• Rezultati Niso Bili Najdeni

MagistrskodeloMentor:izr.prof.dr.MihaelPermanLjubljana,2021 UPORABAGAMZADOLOƒANJECENVZAVAROVALNI’TVU UNIVERZAVLJUBLJANIFAKULTETAZAMATEMATIKOINFIZIKOFinan£namatematika2.stopnjaMatej’avs

N/A
N/A
Protected

Academic year: 2022

Share "MagistrskodeloMentor:izr.prof.dr.MihaelPermanLjubljana,2021 UPORABAGAMZADOLOƒANJECENVZAVAROVALNI’TVU UNIVERZAVLJUBLJANIFAKULTETAZAMATEMATIKOINFIZIKOFinan£namatematika2.stopnjaMatej’avs"

Copied!
73
0
0

Celotno besedilo

(1)

UNIVERZA V LJUBLJANI

FAKULTETA ZA MATEMATIKO IN FIZIKO Finan£na matematika 2. stopnja

Matej ’avs

UPORABA GAM ZA DOLOƒANJE CEN V ZAVAROVALNI’TVU

Magistrsko delo

Mentor: izr. prof. dr. Mihael Perman

Ljubljana, 2021

(2)
(3)

Zahvala

Zahvaljujem se izr. prof. dr. Mihaelu Permanu za strokovno pomo£ in nasvete pri izdelavi magistrskega dela. Zahvala gre tudi Zavarovalnici Sava d. d. za dostop do podatkov uporabljenih v prakti£nem delu magistrskega dela.

Posebej se zahvaljujem tudi Maji za vse vzpodbude in pomo£ ter star²em za potrpeºljivost tekom celotnega ²tudija.

(4)
(5)

Kazalo

Program dela vii

1 Zavarovalni²tvo 3

1.1 O zavarovalni²tvu . . . 3

1.2 Zavarovalna pogodba . . . 3

1.3 Premija . . . 4

1.4 Oblikovanje premije avtomobilskih zavarovanj . . . 5

1.5 Multiplikativni model . . . 6

2 Posplo²eni linearni model - GLM 8 2.1 Linearni model . . . 8

2.1.1 O linearnih modelih . . . 8

2.1.2 Ocenjevanje parametrov linearnega modela po metodi naj- manj²ih kvadratov . . . 10

2.1.3 Ocenjevanje parametrov po metodi najve£jega verjetja . . . . 12

2.2 GLM - Posplo²eni linearni model . . . 13

2.3 Eksponentne druºine porazdelitev . . . 14

2.4 Povezovalna funkcija . . . 16

2.5 Ocenjevanje parametrov . . . 16

3 Posplo²eni aditivni model - GAM 19 3.1 Baza za aproksimacijo . . . 19

3.1.1 Navzkriºna validacija . . . 23

3.2 Aditivni modeli . . . 26

3.3 Posplo²eni aditivni model . . . 27

3.3.1 Ocenjevanje parametrov . . . 28

3.4 Alternativne aproksimacijske baze . . . 29

3.4.1 Kubi£ni zlepki . . . 29

3.4.2 Kubi£ni regresijski zlepki . . . 30

3.4.3 Cikli£ni kubi£ni regresijski zlepki . . . 31

3.4.4 P-zlepki . . . 31

4 Uporaba GLM in GAM 33 4.1 Uporaba GLM in GAM v programskem okolju R . . . 33

4.2 Porazdelitvena funkcija ²kodne pogostnosti . . . 34

4.3 Porazdelitvena funkcija povpre£ne ²kode . . . 35

4.4 Kriteriji za izbiro modela . . . 37

4.4.1 Devianca . . . 37

4.4.2 Pearsonovχ2 test in parameter ϕ . . . 38

4.4.3 AIC . . . 39

5 Primer uporabe GLM in GAM za zavarovanje avtomobilske odgo- vornosti 40 5.1 Predstavitev podatkov . . . 40

5.2 Razredi numeri£nih podatkov . . . 42

(6)

5.3 Zdruºevanje podatkov . . . 45

5.4 Izbira modela . . . 45

5.5 Modeliranje ²kodne pogostnosti . . . 45

5.6 Modeliranje povpre£ne ²kode . . . 49

5.7 Primerjava modelov . . . 52

5.7.1 Primerjava modelov na naklju£nem vzorcu . . . 52

5.7.2 Primerjava modelov znotraj opazovane skupine . . . 54

Literatura 57 Priloga 59 A Izpisi uporabljenih modelov 59 A.1 Povzetek GLM modela ²kodne pogostnosti . . . 59

A.2 Povzetek GAM modela ²kodne pogostnosti . . . 60

A.3 Povzetek GLM modela povpre£ne ²kode . . . 62

A.4 Povzetek GAM modela povpre£ne ²kode . . . 62

(7)

Program dela

Posplo²eni linearni modeli in njihova izvedenka posplo²eni aditivni modeli imajo

²tevilne uporabe. V magistrskem delu predstavite teoreti£no ozadje teh modelov in metode za ocenjevanje parametrov, vklju£no z vpra²anji robustnega ocenjeva- nja in regularizacije. V nadaljevanju predstavite prakti£no uporabo teh modelov v aktuarskem dolo£anju cen obveznega zavarovanja avtomobilske odgovornosti. V teoreti£nem delu se naslonite na vir [8], v prakti£nem pa na vir [1].

Osnovna literatura

[8] S. N. Wood, Generalized additive models, Texts in statistical science, CRC Press/Taylor & Francis Group, Boca Raton, second edition izd., 2017

[1] D. Anderson in dr., A practitioner's guide to generalized linear models, Casu- alty Actuarial Society Discussion Paper Program (2004)

Podpis mentorja:

(8)
(9)

Uporaba GAM za dolo£anje cen v zavarovalni²tvu Povzetek

V magistrskem delu je predstavljen linearni model ter njegovi raz²iritvi: posplo-

²eni linearni model - GLM (iz ang. generalized linear model) ter posplo²eni aditivni model - GAM (iz ang. generalized additive model). Linearni modeli so ²iroko upora- bljani statisti£ni modeli, kjer je pri£akovana vrednost slu£ajne spremenljivke modeli- rana kot se²tevek linearnih prediktorjev. Ta je odvisen od napovednih spremenljivk in nekaterih parametrov, ki jih je potrebno oceniti. Klju£na predpostavka je, da je prediktor linearno odvisen od parametrov, predpostavljeno pa je tudi, da je slu£ajna spremenljivka porazdeljena normalno. V GLM je predpostavka o linearnosti predik- torja posplo²ena in pri£akovana vrednost slu£ajne spremenljivke je tako odvisna od poljubne gladke monotone funkcije linearnega prediktorja. Pri tem lahko slu£ajna spremenljivka pripada druºini eksponentno porazdeljenih spremenljivk (npr. nor- malne, Poissonove, binomske, Gamma, itd.). GAM je ²e dodatna posplo²itev, kjer pa je linearni prediktor predstavljen kot gladka funkcija napovednih spremenljivk.

Te gladke funkcije praviloma nimajo eksaktnega zapisa, zato jih je treba predstaviti in obravnavati njihovo gladkost.

V delu je predstavljena osnova teorija linearnih modelov, GLM in GAM ter primer njihove uporabe v dolo£anju cen zavarovanj avtomobilske odgovornosti.

GAM in insurance pricing Abstract

In master's thesis we will present the linear model and its extensions: the generalized linear model - GLM and the generalized additive model - GAM. Linear models are widely used statistical models in which a univariate response is modelled as the sum of a linear predictors. The linear predictor depends on predictor variables and unknown parameters, which must be estimated. A key feature of the models is that the linear predictor depends linearly on the parameters. Statistical inference is usually based on the assumption that the response variable is normally distributed.

GLM somewhat relaxes the strict linearity assumption of linear models by allowing the expected value of the response to depend on a smooth monotonic function of the linear predictor. Similarly the assumption that the response is normally distributed is relaxed by allowing it to follow any distribution from the exponential family (for example, normal, Poisson, binomial, gamma, etc.). The GAM is a GLM where the linear predictor depends linearly on smooth functions of predictor variables. The exact parametric form of these functions is unknown, as is the degree of smoothness appropriate for them.

A short theoretical introduction to linear models, GLM and GAM will be presented as well as their use for pricing in MTPL insurance.

Math. Subj. Class. (2010): 62J12, 62P05, 97M30

Klju£ne besede: posplo²eni linearni model, posplo²eni aditivni model, dolo£anje cen, zavarovalni²tvo

Keywords: generalized linear model, generalized additive model, pricing, insurance

(10)
(11)

Uvod

Zavarovalni²tvo je pomemben del nan£nega sistema, saj se z obra£unanimi zavaro- valnimi premijami zbirajo denarna sredstva, ki se nato usmerjajo v investicije in s tem v gospodarski razvoj. Zavarovalni²tvo je tako pomembno z makroekonomskega vidika za vsako drºavo. Da bi zavarovalnice dosegale dobre poslovne rezultate, sta klju£ni pravilna izbira tveganj in pravilno dolo£anje cen za ta tveganja. Zavaro- vanje avtomobilske odgovornosti je eno najpomembnej²ih, saj predstavlja velik del pobrane premije in s tem neposredno ter mo£no vpliva na dobi£konosnost zavaro- valnic.

Slika 1: Deleº premije zavarovanj avtomobilske odgovornosti v celotni premiji neºi- vljenjskih zavarovanj glede na Statisti£ni zavarovalni²ki bilten 2020 [9].

Tudi zato je pravilno dolo£anje cen izredno pomembno. V kolikor bi imela zava- rovalnica vse informacije o posamezniku in njegovem vozilu, bi lahko s temi infor- macijami zanj pripravila povsem prilagojeno ceno, ki bi odraºala njegovo rizi£nost na trgu. A ker zavarovalnice vseh teh informacij nimajo na razpolago, morajo za dolo£itev cene uporabiti razli£ne metode, da ponudijo posamezniku ceno, ki bo od- raºala njegovo tveganost, hkrati pa tako zavarovalnica skrbi za svojo dobi£konosnost in konkuren£nost.

V prvem delu si bomo ogledali nekaj osnovnih pojmov v zavarovalni²tvu, ki bodo pomembni za nadaljnje delo. V drugem delu bomo pogledali linearne modele in posplo²ene linearne modele ali angle²ko generalized linear models (GLM), ki jih za dolo£anje cen uporabljajo ²tevilne zavarovalnice. Pri tem sem za pomo£ uporabil deli [3] in [8]. V naslednjem poglavju bomo spoznali posplo²eni aditivni model ali angle²ko generalized additive model (GAM), ki je raz²iritev posplo²enega linearnega modela. Gre za nekoliko kompleksnej²i model, ki za izra£un uporablja ve£ aproksi- macij in s tem omogo£a nekatere prednosti, ki jih posplo²eni linearni model nima.

Tudi tu sem se oprl na delo [8]. ƒetrto poglavje bo namenjeno prakti£ni uporabi GLM in GAM v programskem okolju R. Govorili bomo tudi o na£inu modeliranja ter odlo£itvi o izbranih porazdelitvah. Klju£no teºavo tukaj predstavlja izbira op- timalnega modela oz. parametrov za vsako druºino modelov. Peto poglavje se bo osredoto£ilo na konkreten primer modeliranja zavarovanj avtomobilske odgovorno- sti in primerjavo med obema druºinama modelov, pri £emer bomo izpostavili nekaj

(12)

prednosti in slabosti obeh.

(13)

1 Zavarovalni²tvo

1.1 O zavarovalni²tvu

Zavarovanje je v Slovarju slovenskega knjiºnega jezika [7] denirano kot pravno razmerje, ki zavezuje dolo£eno organizacijo, da upravi£encu povrne ²kodo v dogovor- jenem primeru. Pogosto se uporablja tudi denicija, ki jo je uporabil Boncelj v Zavarovalni ekonomiki: Zavarovanje je ustvarjanje gospodarske varnosti z izravna- vanjem gospodarskih nevarnosti. [2, str. 13].

Ena izmed primarnih nalog zavarovanja je torej, da ²tevilna tveganja, ki so jim zavarovanci izpostavljeni, prerazporedi na vse zavarovance. Za posameznika ne mo- remo vedeti ali bo v prihajajo£em obdobju utrpel neko ²kodo, za dovolj veliko sku- pino zavarovancev pa lahko precej bolje ocenimo kak²no bo ²kodno dogajanje. V kolikor posameznik sklene zavarovanje, bo zavarovalnica prevzela to tveganje in mu bo v primeru ²kode izpla£ala zavarovalnino. V zameno za prevzem tega tveganja pa bo zavarovalnica zara£unala dolo£en znesek. Pretvorba neznanega tveganja za

²kodo v zameno za znano pla£ilo je tudi glavni razlog za sklenitev zavarovanja. Lju- dje smo ve£inoma nenaklonjeni ve£jim tveganjem, ki bi lahko ogrozila na² obstoj ali na£in ºivljenja, zato smo pripravljeni za izravnavanje tega tveganja pla£ati primerno pla£ilo - premijo. S tem negotov dogodek (morebitna ²koda) spremenimo v gotov dogodek (pla£ilo premije).

Nekatera zavarovanja pa so tudi zakonsko obvezna, v kolikor so za to izpolnjeni pogoji. Eno izmed njih je zavarovanje avtomobilske odgovornosti oz. zavarovanje la- stnika vozila proti odgovornosti za ²kodo, povzro£eno tretjim osebam, kot dolo£eno v Zakonu o obveznih zavarovanjih v prometu (ZOZP). Ta dolo£a: Lastnik prome- tnega sredstva mora zavarovanje, ki je po tem zakonu obvezno, skleniti, predno za£ne prometno sredstvo uporabljati v prometu in zavarovanje obnavljati, dokler je prome- tno sredstvo v uporabi. [10, 2. £len ZOZP]. Taka zavarovanja so v podobnih oblikah stalnica v vseh drºavah razvitega sveta. Razlog za zakonsko ureditev tega podro£ja je predvsem v tem, da bi lahko povzro£ena ²koda tretjim osebam bila izredno visoka (na primer v primeru veriºnih tr£enj) in celo presegla premoºenje lastnika vozila. Pri tem bi bile o²kodovane tretje osebe, saj ne bi dobile povrnjenih celotnih sredstev.

Pri zavarovanih vozilih te teºave ni, saj bo ²kodo tem osebam krila zavarovalnica, katere vi²ina sredstev je zagotovljena z razli£nimi regulativnimi instrumenti.

1.2 Zavarovalna pogodba

Za vsako zavarovanje je potrebno skleniti zavarovalno pogodbo, katere sestavni ele- menti so:

ˆ Zavarovalnica

ˆ Zavarovanec

ˆ Zavarovalec

ˆ Upravi£enec

ˆ Predmet zavarovanja ali zavarovana oseba

(14)

ˆ Nabor tveganj, za katera je predmet zavarovan

ˆ Zavarovalna vsota

ˆ Datum izdaje pogodbe

ˆ Trajanje kritja

ˆ Splo²ni in posebni pogoji, ki spadajo k polici

ˆ Premija

Zavarujemo se torej, da prepre£imo na²o ²kodo ob nekem naklju£nem dogodku. Pri tem je pomembno, da gre za nek negotov dogodek v prihodnosti, ki je neodvisen od volje zavarovanca, saj le tako lahko prepre£imo zlorabe zavarovalnih pogodb.

Za potrebe dolo£anja premije je potrebno tudi, da je tveganje mogo£e ovrednotiti ter da je nastalo ²kodo mogo£e oceniti. Za zavarovalnico je pomembno, da £im bolje ugotovi kak²no tveganje prevzema, saj je od tega odvisna premija, ki jo bo zara£unala. V kolikor bo ta prenizka, zavarovalnica tvega, da bo ustvarjala izgubo, v kolikor pa bo previsoka, pa stranka pogodbe ne bo sklenila.

1.3 Premija

Zavarovalna premija je torej znesek, ki ga zavarovanec pla£a zavarovalnici za pre- vzem tveganja. Re£emo ji kosmata ali tudi bruto premija, odvisna pa je od veliko dejavnikov. V grobem se ta deli na funkcionalno in stro²kovno premijo.

Funkcionalna premija zagotavlja sredstva za uresni£evanje osnovne funkcije zava- rovanja. Naprej se deli ²e na tehni£no premijo ter dodatek za preventivo in represijo.

Tehni£na premija zagotavlja, da bo zavarovalnica imela dovolj sredstev, da popla£a vse ²kode zavarovancem. ’e naprej jo delimo v nevarnostno premijo in varnostni do- datek. Nevarnostna premija je premija, ki glede na statisti£ne analize in aktuarske modele v povpre£ju zado²£a za kritje vseh ²kod, varnostni dodatek pa je potreben zaradi moºnih odstopanj od statisti£nih izra£unov v posameznih obdobjih. Z do- datkom za preventivo zavarovalnica zmanj²uje moºnost, da bi do ²kode pri²lo, z dodatkom za represijo pa zmanj²uje ²kodo v primeru, ko je do te ºe pri²lo.

Stro²kovna premija je drugi sestavni del kosmate premije in predstavlja vse stro-

²ke, ki jih ima zavarovalnica z opravljanjem svoje dejavnosti. Sem beleºimo na primer stro²ke pridobivanja zavarovanj, cenilne stro²ke, stro²ke zaposlenih in ostale administrativne stro²ke.

Klju£en del pri izra£unu premije je prav izra£un nevarnostne premije. Ta del je eden izmed najve£jih, saj mora pokriti ²kode, ki bodo nastale iz tveganj prejetih zavarovanj. Ob sklenitvi zavarovanja seveda ne vemo kak²ne bodo te ²kode, zato moramo pri£akovano ²kodo oceniti. V praksi to izra£unamo iz statistike preteklih

²kod, pri tem pa je seveda treba upo²tevati tveganja enake vrste.

Zavarovana tveganja skupaj obi£ajno poimenujemo portfelj zavarovalnice. Ve- likost tega lahko merimo na ve£ na£inov, najpogostej²i je glede na obseg vpla£ane premije. Za potrebe ocene pri£akovane ²kode pa je pomembnej²a izpostavljenost.

(15)

Izpostavljenost je enota, s katero zavarovalnica meri ²tevilo rizikov, ki jim je izposta- vljena v nekem £asovnem intervalu. Ta je poljubno izbran, a pri avtomobilskih zava- rovanjih se tipi£no uporablja £asovni interval enega leta. Tako bi imela zavarovalna polica sklenjena za avtomobilsko odgovornost v trajanju enega leta izpostavljenost 1.

Primer 1.1. Zavarovalnica je v preteklosti sprejela v zavarovanjeN enoletnih polic zavarovanja avtomobilske odgovornosti (AO). Vemo koliko ²kod in kako visoke ²kode so se zgodile na teh policah. Imamo torej ²tevilo ²kod k, z vi²inami x1, x2, ..., xk. Skupen znesekSN vseh ²kod tako zna²a

SN =

k

∑︂

i=1

xi.

Pri tem smo predpostavili, da so vse ²kode ºe zaklju£ene, torej ne pri£akujemo dodatnih ²kod ali sprememb v vi²inah ²kode. Intuitivno bi bilo smiselno gledati nevarnostno premijo (np) kot skupno ²kodo na enoto izpostavljenosti

np= SN N .

V kolikor desno stran ena£be pomnoºimo z k v ²tevcu in imenovalcu lahko rezultat predstavimo na na£in, ki si ga lahko interpretiramo ²e druga£e.

np= k·SN

k·N = k N · SN

k .

ˆ ’kodna pogostnost (sp) predstavlja ²tevilo ²kod na enoto izpostavljenosti sp= k

N.

ˆ Povpre£na ²koda (ps)predstavlja povpre£no izpla£ano ²kodo ps= SN

k . Tako velja tudi preprosta enakostnp =ps·sp.

Pristop z delitvijo na ²kodno pogostnost in povpre£no ²kodo je zelo pogosto v uporabi pri izra£unu nevarnostne premije premoºenjskih zavarovanj. To delitev uporabimo tudi pri linearnih modelih, posplo²enih linearnih modelih in posplo²enih aditivnih modelih, ki bodo predstavljeni v nadaljevanju.

1.4 Oblikovanje premije avtomobilskih zavarovanj

Z vidika izra£una nevarnostne premije je za zavarovalnico smiselno imeti £imve£je

²tevilo zavarovanj, saj se s tem manj²a varianca ocene povpre£nega tveganja, ki ga je sprejela. S tem lahko bolj natan£no oceni pri£akovano ²kodo, ki je enaka nevarnostni premiji. To nam pove centralni limitni izrek.

(16)

Izrek 1.2. (Centralni limitni izrek): Naj bodo X1, X2, ... neodvisne, enako porazde- ljene slu£ajne spremenjlivke, za katere velja

E[Xi] =µ, V ar[Xi] =σ2. Potem za vsoto Sn =X1+X2+...+Xn velja

E[Sn] =nµ, V ar[Sn] =nσ2. Ko pa gre n → ∞, velja

Sn−nµ

√nσ

−−−→d

n→∞ N(0,1), kar lahko zapi²emo tudi kot

√n (︃Sn

n −µ )︃ d

−−−→n→∞ N(0, σ2).

Zagotovo pa vsa zavarovanja niso enaka med sabo, saj so odvisna od svojih la- stnosti. Eden najo£itnej²ih primerov pri avtomobilski odgovornosti so mladi vozniki oz. vozniki brez izku²enj. Za te se pri£akuje, da bo zaradi neizku²enosti njihovo pri-

£akovano ²kodno dogajanje vi²je od povpre£ja. ƒe bi torej vsi zavarovanci za enako kritje pla£evali enako, bi to pomenilo, da bi manj rizi£ni zavarovanci sonancirali bolj rizi£ne zavarovance. To niti ne bi bilo teºavno, £e bi na trgu obstajala le ena zavarovalnica. V kolikor pa je zavarovalnic ve£, pa lahko ena izmed zavarovalnic s tem, da manj rizi£nim zavarovancem ponudi bolj ugodno ceno, pridobi te v svoj portfelj. Tako bi zavarovalnici, ki cene ne prilagaja, ostali le slab²i zavarovanci, ki bi pla£evali premalo, s tem pa bi zavarovalnica dosegla slab²e rezultate.

Obstaja lahko veliko faktorjev, ki vplivajo na rizi£nost. Pri avtomobilskih za- varovanjih so to najpogosteje faktorji, ki so bodisi lastnosti voznika vozila (starost, vozni²ke izku²nje, spol, kraj bivanja, ... ) ali pa lastnosti vozila (starost vozila, mo£

vozila, dodatna oprema vozila, ... ). Ob£asno lahko na nevarnostno premijo vplivajo tudi nekatere lastnosti povezane s sklepanjem zavarovanja (nabor dodatnih kritij,

£as trajanja zavarovanja, ... ), saj tudi ta lahko povejo kaj o rizi£nosti. Pri faktorjih pa se hitro pojavi ve£ teºav. Najve£ja teºava je ta, da zgodovinskih podatkov za posamezen faktor sploh nimamo na razpolago, so ti teºko merljivi (izku²nje voznika) ali pa so izredno nezanesljivi. Posamezni faktorji so lahko med sabo neodvisni ali pa korelirani (na primer mo£ vozila in nabavna vrednost vozila). Nekaterih faktorjev, kot na primer spol, zakonsko ni dovoljeno uporabljati, saj predstavljajo nepo²teno diskriminacijo. Tudi £e bi imeli na razpolago veliko ²tevilo zanesljivih faktorjev, pa moramo paziti, da model ne bi postal zelo kompleksen, saj lahko tako povzro£imo prekomerno prilagajanje podatkom iz preteklosti.

1.5 Multiplikativni model

Kot je bilo omenjeno ºe v zgornjem poglavju, je pomembno, da zavarovance raz- poredimo v razrede na podlagi njihovih lastnosti. To pomeni, da so znotraj enega

(17)

razreda le zavarovanci, ki se popolnoma ujemajo v svojih lastnostih. Vsem tem zavarovancem pripada enaka premija, zato pravimo, da spadajo v enak premijski razred. ƒe bi na primer uporabili le indikator ali je zavarovanec mladi voznik (splo-

²na oznaka za voznike do 21. leta ali voznike z manj kot 2 leti vozni²kih izku²enj), bi tako dobili dva lo£ena premijska razreda in dve razli£ni premiji. Teºava nastane z ve£anjem ²tevila faktorjev. ƒe imamo p lastnosti (faktorjev) in ima vsaka izmed lastnostiki razredov,i= 1,2, ..., p, je ²tevilo premijskih razredov kar ∏︁p

i=1ki. Torej

²tevilo razredov raste hitro s ²tevilom faktorjem in s tem na²i razredi postajajo ve- dno manj²i. Posledi£no se nam lahko zgodi, da posameznim razredom pripada zelo malo zavarovancev in s tem se varianca ocenjenega tveganja znotraj tega razreda mo£no pove£a. V katerem izmed razredov morda celo ne bomo imeli nobenega za- varovanca, s £imer za novega zavarovanca, ki bi bil uvr²£en v ta razred ne znamo izra£unati nevarnostne premije. Najpogostej²a re²itev te teºave je multiplikativni model. Pri multiplikativnem modelu predpostavimo, da lastnosti zavarovanca na njegovo rizi£nost vplivajo multiplikativno. To pomeni, da lahko lastnost uporabimo pri izra£unu njegove ²kodne pogostnosti, povpre£ne ²kode ali pa nevarnostne premije neposredno.

Naj i predstavlja premijski razred, za katerega ºelimo oceniti tveganje µi. Naj bo na² model sestavljen iz p razli£nih faktorjev, torej lahko i-ti premijski razred ustreza enemu razredu znotraj vsakega faktorja. Torej ga lahko zapi²emo kot i = (i1, i2, ..., ip), kjer z ij ozna£imo razred j-tega faktorja. Multiplikativni model pred- postavlja, da lahko µi zapi²emo kot

µi0γ1i1γ2i2. . . γpip,

kjer γji za j = 1, ..., p pove, koliko se rizi£nost premijskega razreda spremeni na podlagi j-tega faktorja, £e pripada nivoju ij, glej [3]. V kolikor posamezni nivo na rizi£nost ne vpliva, bo za ta nivo ij veljalo γjij = 1. ƒe za nek j velja γjij = 1 za vse ij, re£emo da faktor ne vpliva na rizi£nost.

Multiplikativni model uporablja korelacije med faktorji, ne upo²teva pa interak- cij, ki bi se med faktorji lahko pojavile. Primer interakcije bi bila interakcija med starostjo in spolom, kjer so razli£ne ²tudije pokazale, da so predvsem v starostni skupini do 30 let mo²ki bolj rizi£ni kot ºenske, kasneje pa razlike v rizi£nosti niso tako velike. GLM tako ne upo²teva interakcij med faktorji, £e ne ustvarimo poseb- nih faktorjev, da te interakcije zajamemo. GAM ima moºnost upo²tevanja interakcij med ve£ spremenljivkami. To lahko opravimo z razli£nimi funkcijami spremenljivke v odvisnosti od faktorja ali pa z aproksimacijskimi funkcijami ve£ dimenzij. Zadnje presega obseg tega dela, a je vpogled v to omogo£en v priro£niku Simona Wooda [8].

(18)

2 Posplo²eni linearni model - GLM

2.1 Linearni model

2.1.1 O linearnih modelih

Linearni modeli so najpreprostej²i izmed modelov, ki so predstavljeni v tem delu.

Z njim izrazimo odvisnost slu£ajne spremenljivke Y, ki je odzivna spremenljivka od napovedovalnih spremenljivk Xj, j = 1,2, ..., p. Pri tem je Y res slu£ajna spre- menljivka, katere izid ozna£imo z y. Predpostavka linearnega modela je, da lahko zapi²emo Y kot

Y =µ+ϵ,

kjer je µ=E[Y] pri£akovana vrednost inϵ slu£ajna spremenljivka napake. Predpo- stavki linearnega modela sta naslednji:

1. Pri£akovano vrednost µ lahko zapi²emo kot linearno kombinacijo neodvisnih spremenljivk Xj.

2. Napaka ϵ je normalno porazdeljena z vrednostjo 0 in varianco σ2. Torej ϵ ∼ N(0, σ2).

Torej lahko zapi²emo zgornjo ena£bo tudi kot

Yi =

p

∑︂

j=1

βjxiji.

Zgornji zapis lahko prikaºemo tudi vektorsko. Vektor y= [y1, y2, ..., yn]T predstavlja izide slu£ajnega vektorja Y = [Y1, Y2, ..., Yn]T pri ²tevilu podatkovn. MatrikaX bo predstavljala na²e neodvisne napovedne spremenljivke. i-ta komponenta vektorja Y se nana²a na i-to vrstico matrike X, zato bomo za to vrstico uporabljali zapis Xi. Da je sistem Y = βX +ϵ re²ljiv, torej, da parametre lahko ocenimo, mora veljati, da ²tevilo parametrov r ne sme biti ve£je od ²tevila podatkov oz.r≤n. Pri tem r ni ²tevilo faktorjev, temve£ se²tevek nivojev vseh faktorjev. ƒe je faktorjev p, je torej r =∑︁p

i=1ki. Za opisne spremenljivke se pogosto uporablja indikatorske spremenljivke. Te so tiste, ki zavzamejo vrednosti 1 ali 0. ƒe je uporabnik del skupine, se uporablja 1, sicer se uporablja0. Poglejmo si primer.

Primer 2.1. Imejmo 6 zavarovancev, ki smo jih razvrstili glede na podro£je bivanja.

Ta so lahko mesto, predmestje ali podeºelje. Prva dva sta iz mesta, naslednja dva iz predmestja in zadnja dva iz podeºelja. Velja torej

E(Yi) = µi =

β0 mesto β1 predmestje β2 podeºelje

,

(19)

kar lahko predstavimo v matri£ni obliki

⎣ µ1

µ2 µ3 µ4

µ5 µ6

=

1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1

⎣ β0 β1 β2

⎦.

ƒe ºelimo, da vsaka izmed lastnosti vpliva na kon£no ceno, je smiselno postaviti neko izhodi²£no vrednost. To lahko naredimo na naslednji na£in

⎣ µ1 µ2 µ3 µ4 µ5 µ6

=

1 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 1 0 0 1 1 0 0 1

⎣ α β0 β1 β2

⎦ ,

pri £emer boα predstavljala izhodi²£e. A teºava nastopi, ker tak sistem ne bo imel enoli£ne re²itve. ƒe bi na primerα od²teli poljubno ²tevilo in nato vsakemu izmed β0, β1, β2 to ²tevilo pri²teli, ²e vedno dobimo enak vektor. Zato vedno dolo£imo izhodi²£ni razred (v ang. Intercept). V na²em primeru naj bo izhodi²£ni razred z nivojem mesto. To lahko matri£no predstavimo na naslednji na£in

⎣ µ1

µ2 µ3 µ4

µ5 µ6

=

1 0 0 1 0 0 1 1 0 1 1 0 1 0 1 1 0 1

⎣ α β1 β2

⎦.

Pri tem nismo izgubili nobenih informacij. Prvi stolpec matrike predstavlja izhodi-

²£e, nadaljnji stolpec pa predstavlja spremembo od izhodi²£nega razreda.

Za izhodi²£e lahko izberemo poljubni razred, a £e ºelimo £im bolj stabilne rezul- tate, je smiselno, da za izhodi²£ni razred izberemo tistega, ki je med na²imi podatki najbolj zastopan, torej razred z najve£jo izpostavljenostjo.

ƒe imajo modeli izbrani izhodi²£ni razred, se v literaturi pogosto za prvi element vektorja β uporablja kar β0 namesto α uporabljenega v zgornjem primeru.

Primer 2.2. Poglejmo si nekaj preprostih linearnih modelov.

1. Yi = µ+ϵi = β0 +xiβ1i predstavlja modeliranje y v odvisnosti od ene spremenljivke x s premico.

2. Yi =µ+ϵi0+xiβ1+x2iβ2+x3iβ3i predstavlja modeliranjeyv odvisnosti od ene spremenljivkex s kubi£nim polinomom.

3. Yi = µ+ϵi = β0+xiβ1 +ziβ2 + log(xizi3i predstavlja modeliranje y v odvisnosti od dveh spremenljivk x, z in logaritmom njunega produkta.

(20)

Vse to so linearni modeli, saj tako napakeϵikot tudi parametriβj nastopajo v ena£bi linearno.

Predpostavke linearnega modela so naslednje [1]:

1. Slu£ajna komponenta: vsaka komponenta slu£ajnega vektorja Y je neod- visna in normalno porazdeljena. Pri£akovane vrednosti µi so lahko razli£ne, a vse imajo skupno varianco σ2.

2. Sistemati£na komponenta: linearna kombinacija r spremenljivk nam da linearni prediktor η

η =Xβ .

3. Povezovalna funkcija: odvisnost med slu£ajno spremenljivko in sistema- ti£no komponento je dolo£ena s povezovalno funkcijo. V linearnem modelu je povezovalna funkcija kar identiteta

E(Y) = µ=η.

2.1.2 Ocenjevanje parametrov linearnega modela po metodi najmanj²ih kvadratov

Iskanje optimalnega modela zahteva ocenjevanje koecientov βi, ki ga opravimo z metodo minimizacije vsote kvadratov. Poglejmo najprej primer, ko ocenjujemo le en parameter β, torej primer linearne regresije. Minimiziramo funkcijo

S=

n

∑︂

i=1

(yi−µi)2 =

n

∑︂

i=1

(yi−xiβ)2 glede na β. V matri£ni obliki to zapi²emo kot

S =∥y−µ∥2 =∥y−Xβ∥2. (2.1)

Minimum najdemo tako, da ena£bo odvajamo po β

∂S

∂β =−

n

∑︂

i=1

2xi(yi−xiβ).

Ko izena£imo odvod z 0, dobimo naslednjo oceno βˆ︁za parameter β

n

∑︂

i=1

2xi(yi−xiβ) = 0ˆ︁ ⇒

n

∑︂

i=1

xiyi−βˆ︁

n

∑︂

i=1

x2i = 0 ⇒βˆ︁=

∑︁n i=1xiyi

∑︁n i=1x2i

Taka cenilka je nepristranska in najbolj²a moºna linearna cenilka za β. Da po- kaºemo nepristranskost, poglejmo pri£akovano vrednostβˆ︁, tako, da izideyi slu£ajne spremenljivke Yi nadomestimo s slu£ajno spremenljivko samo.

βˆ︁=

∑︁n i=1xiYi

∑︁n i=1x2i

(21)

Pri£akovana vrednost je

E(β) =ˆ︁ E (︄∑︁n

i=1xiYi

∑︁n i=1x2i

)︄

=

∑︁n

i=1xiE(Yi)

∑︁n

i=1x2i =

∑︁n i=1x2iβ

∑︁n

i=1x2i =β.

Za nadaljnja poglavja in ocenjevanje parametrov βj je koristno postopek pogledati v matri£ni obliki s pomo£jo QR razcepa. Vrednost ena£be 2.1 bo ostala enaka, v kolikor na del y−Xβ apliciramo poljubno rotacijo. X je matrika dimenzij n×p, ki jo lahko s pomo£jo QR razcepa zapi²emo kot

X =Q [︃R

0 ]︃

=QfR,

kjer R predstavlja p×pzgornjetrikotno matriko, Q pa n×n ortogonalno matriko.

Spomnimo se, da ortogonalne matrike ob mnoºenju predstavljajo zrcaljenja ali ro- tacije, ki pa ne spreminjajo dolºine. Ker vemo QTQ=QQT =I, lahko ena£bo 2.1 prepi²emo v

∥y−Xβ∥2 =⃦

⃦QTy−QTXβ⃦

2 =

QTy− [︃R

0 ]︃

β

2

.

Ob tem zapi²imo ²e QTy = [f, r]T, kjer je f vektor dimenzij p, vektor r pa torej dimenzij n−p. S tem zapisom ²e dodatno poenostavimo ena£bo

∥y−Xβ∥2 =

⃦ [︃f

r ]︃

− [︃R

0 ]︃

β

2

=∥f−Rβ∥2+∥r∥2,

s tem pa vidimo, da izra£un vsote kvadratov razpade na del odvisen ob β ter del neodvisen od β. Z izbiro take β, da bo Rβ = f, bo prvi del enak 0, ostal pa nam bo le del ∥r∥2. Ob izbiri takega

βˆ︁=R−1f je ∥r∥2 =⃦

⃦y−Xβˆ︁⃦

2 najmanj²a moºna vsota kvadratov.

O tem, da je to cenilka z najniºjo varianco, govori izrek Gauss-Markova. Bralec ga lahko najde na primer v knjigi [8, stran 18].

Denirajmo ²e inuen£no matriko A linearnega modela. To bo matrika, ki ob mnoºenju z vektorjem opazovanj y da vektor ocen µˆ︁=Xβˆ︁. Zapi²imo βˆ︁ob rotaciji Qf, prvih p vrstic matrikeQ

βˆ︁=R−1QTfy.

Ob tem, ko vemo tudix=QfR, torej lahko ˆ︁µzapi²emo na naslednji na£in µˆ︁=QfRR−1QTfy=QfQTfy

in proglasimo A =QfQTf. Tako torej velja µˆ︁= Ay. Matrika A ima ve£ zanimivih lastnosti, tu omenimo le, da je njena sled ravno ²tevilo parametrov modela, torej tr(A) = p.

(22)

2.1.3 Ocenjevanje parametrov po metodi najve£jega verjetja

Na re²evanje problema ocenjevanja parametrov β pa lahko gledamo tudi kot na re²evanje problema po metodi najve£jega verjetja. Osnovna ideja je, da za slu£ajno spremenljivkoY zapi²emo gostoto verjetnostif(β, σ2, y), pri £emer ºelimo ocenitiβ. To bomo posku²ali glede na opazovane rezultate y. Pri tem bomo upo²tevali, da so bolj verjetni tisti parametri, ki so za dane realizacije y napovedali vi²jo verjetnost, kot tisti, ki so za te realizacije napovedali niºjo verjetnost. Vzeli bomo torej tiste parametre β, ki maksimizirajo verjetnost, da so se realizacije y zgodile. Poglejmo si gostoto verjetnosti slu£ajne spremenljivke Y. Pri tem opozorimo, da Xi ponovno pomeni i-to vrstico matrike X.

f(β, σ2, yi) = 1

2πσ2 exp(−(yi−Xiβ)22 )

Ker predpostavljamo, da so Yi za i = 1, .., n neodvisne slu£ajne spremenljivke, bo tako funkcija verjetja L(β, σ2, yi)kar produkt gostot verjetnosti yi

L(β, σ2, yi) =

n

∏︂

i=1

f(β, σ2, yi) =

n

∏︂

i=1

√ 1

2πσ2 exp{︂−(yi−Xiβ)22

}︂

= 1

(√

2πσ2)nexp{︂

− ∥y−Xβ∥2 1 2σ2

}︂

.

Za re²evanje bomo uporabili logaritem funkcije verjetja, saj vemo, da je vrednost, ki maksimizira L, hkrati tudi vrednost, ki maksimiziral(β, σ2, yi) = logL(β, σ2, yi). Logaritem funkcije verjetja je torej

l(β, σ2, y) =−n

2(log(2π) + logσ2)− 1

2(y−Xβ)T(y−Xβ).

Za iskanje maksimuma posameznih parametrov uporabimo parcialne odvode

∂βl(β, σ2, y) = 1

2(Y −Xβ)TX = 0

∂σ2l(β, σ2, y) = n

2 + 1

4(Y −Xβ)T(Y −Xβ) = 0.

Iz tega pa sledi:

βˆ︁= (XTX)−1XTY.

V kolikor ºelimo oceniti tudi parameter σ2, pa ga lahko ocenimo s pomo£jo cenilke βˆ︁. Tako bo σˆ︁2, cenilka za σ2, enaka

σˆ︁2 = 1

n−p(Y −Xβ)ˆ︁ T(Y −Xβ).ˆ︁

Metoda najve£jega verjetja se bo za klju£no izkazala kasneje pri iskanju parame- trov posplo²enega linearnega modela.

Linearni modeli imajo kar nekaj omejitev, ki se pojavijo v prakti£ni uporabi.

Na²tejmo nekaj najpomembnej²ih:

(23)

ˆ Predpostavka normalne porazdelitve sicer za linearni model oz. linearno regresijo ni nujna, a se zelo pogosto predpostavlja. V razli£nih primerih ºelimo modelirati spremenljivkeYi, za katere pa vemo, da niso porazdeljene normalno, na primer ²tevilo ²kod. Predpostavka normalne porazdelitve pomeni tudi, da zavzema tako pozitivne kot tudi negativne vrednosti. Tako z njo ne moremo modelirati spremenljivke Yi, za katero vemo, da je nenegativna (npr. vi²ina

²kode).

ˆ Konstantna varianca je prav tako nekaj, kar nam predstavlja dodatno ome- jitev. Ta je lahko odvisna na primer od pri£akovane vrednosti Yi.

ˆ Povpre£na vrednost Yi je linearna funkcija Xi, kar ni nujno najpri- mernej²e. Za dolo£anje tveganja se zdi primernej²i na primer multiplikativni model omenjen v razdelku 1.5.

V praksi je seveda ogromno spremenljivk, za katere vemo, da niso porazdeljene normalno. Zato je v pogosti uporabi posplo²eni linearni model - GLM, ki s posplo-

²itvijo nekaterih predpostavk linearnega modela odpravlja omenjene teºave.

2.2 GLM - Posplo²eni linearni model

Zaradi vseh pomankljivosti sta ºe leta 1972 Nelder in Weddeburn v svojem delu Generalized linear models predstavila posplo²ene linearne modele. Ti so se izkazali za zelo uporabne, saj se u£inkovito soo£ijo s predpostavko normalnosi, konstantno varianco in linearno odvisnostjo Yi od napovednih spremenljivk. Za odzivno spre- menljivkoYi je sedaj dovolj, da pripada druºini eksponentno porazdeljenih spremen- ljivk. Prav tako se lahko varianca spreminja z pri£akovano vrednostjo porazdelitve.

Pomembno pa je, daYi ni ve£ odvisna odXi linearno, temve£ je ta linearnost lahko predstavljena preko neke transformacije µi. Kot doslej, Xi predstavlja vrstico ma- trike X.

Podobno kot pri linearnem modelu poglejmo predpostavke posplo²enega linear- nega modela:

1. Slu£ajna komponenta: vsaka komponenta slu£ajnega vektorja Y je neodvi- sna in in porazdeljena glede na porazdelitev iz eksponentne druºine spremen- ljivk.

2. Sistemati£na komponenta: linearna kombinacija r spremenljivk nam da linearni prediktor η. Pri tem razumemo X kot X = [X1, X2, ..., Xn]T.

η =Xβ.

3. Povezovalna funkcija: odvisnost med slu£ajno spremenljivko in sistema- ti£no komponento je dolo£ena s povezovalno funkcijog. To je lahko poljubna odvedljiva monotona funkcija

E(Y) =µ=g−1(η).

(24)

Preden se lotimo razlage posameznih to£k, pa poglejmo kako sploh praviloma zapi²emo GLM

µi =E(Yi) = g−1(Xiβ).

2.3 Eksponentne druºine porazdelitev

Druºina eksponentnih porazdelitev vsebuje porazdelitve, ki so v praksi uporabne za modeliranje. Mednje spadajo na primer Poissonova, binomska, eksponentna, gamma in normalna porazdelitev. Formalno, porazdelitev pripada druºini eksponentno po- razdeljenih spremenljivk, £e je denirana s porazdelitveno funkcijo dveh parametrov naslednje oblike

f(y, θ, ϕ) = exp{︂yθ−b(θ)

a(ϕ) +c(y, ϕ)}︂

, kjer so a, b in cdane funkcije. Nekaj pogojev za te funkcije:

ˆ a(ϕ) je pozitivna in zvezna funkcija,

ˆ b(θ)je dvakrat odvedljiva z pozitivnim drugim odvodom, torej konveksna funk- cija,

ˆ c(y, ϕ) je neodvisna od θ,

ob tem, da mora biti f gostota porazdelitve, torej mora biti integral pa njenem denicijskem obmo£ju enak 1. Poglejmo si, kaj predstavljajo a(ϕ),b(θ) inc(y, θ) za normalno porazdelitev.

fµ(y) = 1 σ√

2π exp

{︂−(y−µ)22

}︂

= exp

{︂−y2+ 2yµ−µ2

2 −log(σ√ 2π)

}︂

= exp{︂yµ−µ222 − y2

2 −log(σ√ 2π)}︂

,

kjer je θ = µ, b(θ) = θ2/2 = µ2/2, a(ϕ) = ϕ = σ2 in c(y, ϕ) = −y2/(2ϕ) − log(√

ϕ·2π).

Parametruθ ob£asno pravimo kanoni£ni parameter, parametru ϕ pa razpr²eno- stni parameter. V GLM modelu bo θ popolnoma odvisen od parametrov modelaβ. Za funkcijo a(ϕ) se zelo pogosto uporablja

a(ϕ) = ϕ

ω, (2.2)

kjer ω predstavlja uteº, torej neko vnaprej denirano vrednost. V zavarovalni²tvu sta to najpogosteje izpostavljenost (pri modeliranju ²kodne pogostnosti) ali ²tevilo

²kod (pri modeliranju povpre£ne ²kode).

Pri GLM bomo predpostavili, da je θ odvisen od i, saj se razlikuje za vsako realizacijo, ϕ pa je enak za vse realizacije. Predpostavljeno je tudi, da so a(ϕ), b(θ) in c(y, ϕ) enaki za vse i. Tako so vsi Yi enakega tipa, a s spremembami θ se

(25)

spreminja povpre£na vrednost. Parametraθiinϕpovzemata informacije o povpre£ni vrednosti in varianci Yi. Da to pokaºemo, je koristno obravnavati logaritem gostote porazdelitve log(fθ(y)), ob znanemy, kot funkcijo θ. Ta je

l(θ) = yθ−b(θ)

a(ϕ) +c(y, ϕ), parcialni odvod funkcije pa je

∂l

∂θ = y−b(θ) a(ϕ) .

ƒe nal gledamo kot na slu£ajno spremenljivko in nadomestimo v ena£bi realizacije y s slu£ajno spremenljivko Y, lahko pogledamo pri£akovano vrednost:

E (︂∂l

∂θ )︂

= E(Y)−b(θ) a(ϕ) .

Ob upo²tevanju E(∂l/∂θ) = 0 (dokaz lahko najdemo v [8, stran 406]), vidimo, da velja

µi =E(Y) = b(θ).

Ena£ba pravzaprav implicitno denira θi kot funkcijo µ. ƒe inverz b(θ) obstaja, potem lahko zapi²emo parameter θ kot funkcijo µ

θ = (b)−1(µ).

Vemo pa, da lahko µzapi²emo kot

µ=g−11x1+· · ·+βpxp), s £imer jeθ torej funkcija odvisna od βi

θ = (b)−1(g−11x1+· · ·+βpxp)),

s tem pa se pokaºe tudi, da je porazdelitev Y odvisna od parametrov GLM modela β1, ..., βp.

S pomo£jo ponovnega odvajanja gostote lahko dobimo naslednjo lastnost V ar(Y) =b′′(θ)a(ϕ),

pri £emer je a(ϕ) lahko poljubna funkcija ϕ. Pri GLM modelih to ve£inoma ni teºavno, saj je ϕ znan. V kolikor ϕ ne bi bil znan, pa si lahko pomagamo tudi z zapisom iz ena£be 2.2 in zapi²emo

V ar(Y) =b′′(θ)ϕ

ω =V(µ)ϕ,

kjer je V(µ) = b′′(θ)/ω varian£na funkcija, ta pa je znana za posamezne slu£ajne spremenljivke. V tabeli so prikazane vrednosti ϕ, µ(θ) in V(µ) za nekaj primerov

(26)

porazdelitev.

Porazdelitev f(y) θ ϕ V(µ)

Normalna σ1exp{︁−(y−µ)2 2

}︁ µ σ2 1

Poissonova µyexp(−µ)y! log(µ) 1 µ

Binomska (︁n

k

)︁(µn)y(1− µn)n−y log(n−µµ ) 1 µ(1− µn) Gamma Γ(v)1 (vµ)vyv−1exp(−vyµ) −µ1 1v µ2 Inverzna Gausova √︂ γ

2πy3 exp{︁−γ(y−µ)2 2y

}︁ −12

1

γ µ3

2.4 Povezovalna funkcija

V linearnem modelu je matemati£no upanje neodvisne slu£ajne spremenljivke Yi de- nirano kot linearna kombinacija odvisnih spremenljivkxj, j = 1, ..., r, kjer je bilor

²tevilo parametrov. V matriki so bile te zapisane v i-ti vrstici matrike X, torej Xi. Povezovalna funkcija med Yi in Xi je bila torej identiteta. V posplo²enem linear- nem modelu pa lahko namesto identitete nastopa poljubna monotona in odvedljiva funkcija. Za vektor µ= (µ1, ..., µn) mora torej veljati:

g(µ) = η=Xβ.

Za multiplikativni model opisan v poglavju 1.5 je primerna logaritemska povezovalna funkcija

g(µi) = logµi. Tako koecienti βi postanejo multiplikativni

µi =g−11xi1 +...+βrXir) = exp(βixi1)· · ·exp(βrxir).

V praksi se zelo pogosto uporablja tudi logit povezovalna funkcija, ki je posebej uporabna za modeliranje verjetnosti dogodkov. Predstavimo jo kot

η=g(µi) = ln (︃ µi

1−µi )︃

.

2.5 Ocenjevanje parametrov

Za vsak model je klju£no, da parametre modela £im bolje ocenimo. V GLM modelu, kjer je µ=E(Y), predpostavljamo, da za model velja

g(µi) = Xiβ, Yi ∼fθi(yi),

kjer je fθi(yi) porazdelitev iz druºine eksponentno porazdeljenih spremenljivk s pa- rametrom θi odvisnim odµi. Glede na y, realizacije spremenljivke Y, ºelimo oceniti β. Ocenjujemo z metodo najve£jega verjetja. Ob predpostavki, da soYimedsebojno neodvisne, je verjetje naslednje

L(β) =

n

∏︂

i=1

fθi(yi).

(27)

Za dolo£itev β moramo torej maksimizirati funkcijo L, kar pa je ekvivalentno, kot da bi maksimizirali logaritem te funkcije, torej maksimizacija logL(β) =l(β)

l(β) = logL(β) = log

n

∏︂

i=1

fθi(yi) =

n

∑︂

i=1

logfθi(yi) =

n

∑︂

i=1

(︂yiθi−bii)

ai(ϕ) +ci(ϕ, yi) )︂

. Pri tem opozorimo, da je θi pravzaprav implicitna funkcija odvisna ob β. Kot ºe opisano, se pogosteje uporablja oznaka z uteºjo ω, s £imer ena£ba postane

l(β) =

n

∑︂

i=1

ωi(︂yiθi−bii) ϕ

)︂

+ci(ϕ, yi)

= 1 ϕ

n

∑︂

i=1

ωi(yiθi−bii)) +

n

∑︂

i=1

ci(ϕ, yi).

Ker na tem mestu ºelimo dobiti le oceno za θ, bomo zgornjo ena£bo preoblikovali v obliko, da bomo ocenjevali vektor β in uporabili Newtonovo metodo. Vemo, da velja µi = bi) in g(µi) = ηi = X_ibmβ. S tem je θi odvisna od β in lahko logaritem funkcije verjetja maksimiziramo glede na vrednosti βi, tako, da funkcijo verjetja odvajamo po βi s posrednim odvodom po θi

∂l

∂βj =

n

∑︂

i=1

∂l

∂θi

∂θi

∂βj = 1 ϕ

n

∑︂

i=1

ωi(︂

yi∂θi

∂βj −bii)∂θi

∂βj )︂

, ob tem pa bomo odvod razpisali na naslednji na£in

∂θi

∂βj = ∂θi

∂µi

∂µi

∂βj = ∂θi

∂µi

∂ηi

∂βj

∂µi

∂ηi = Xij gi)b′′i). Za zadnjo enakost smo upo²tevali naslednje znane enakosti

µi =bi)⇒ ∂µi

∂θi

=b′′i)⇒ ∂θi

∂µi

= 1

b′′i);

∂ηi

∂µi =gi)⇒ ∂µi

∂ηi = 1 gi); ηi =Xiβ⇒ ∂ηi

∂βj =xij,

kjer so v zadnji vrstici xij elementi matrike X na mestu (i, j). Nadaljujmo z ra£u- nanjem odvodal:

∂l

∂βj = 1 ϕ

n

∑︂

i=1

ωi yi−bi)

gi)b′′i)Xij = 1 ϕ

n

∑︂

i=1

(yi−µi)

gi)V(µi)Xij. (2.3) Odvajajmo ponovno

2l

∂βj∂βk = 1 ϕ

n

∑︂

i=1

{︂ XikXij

gi)2V(µi) +(yi −µi)Vi)XikXij gi)2v(µi)2 + (yi−µi)Xijg′′i)Xik

gi)3V(µi) }︂

=−1 ϕ

n

∑︂

i=1

XikXijα(µi) gi)2V(µi),

(28)

pri £emer smo v α(µi) zdruºili

α(µi) = 1 + (yi−µi)(︂Vi)

V(µi) + g′′i) gµi

)︂

. Tudi upanje E(∂β2l

j∂βk)bo enako temu, le α(µi) = 1. Denirajmo tudiW kot diago- nalno matriko z elementi wi, ti pa so

wi = α(µi) gi)2V(µi).

S tem pa lahko izrazimo Hessejevo matriko logaritma verjetja z -XW X/ϕ. ƒe deniramo ²e diagonalno matriko Gz elementi

Gii= gi) α(µi),

lahko korak Newtonove metode zapi²emo na naslednji na£in βk+1k+ (XW X)−1XTW G(y−µ)

= (XW X)−1XTW(G(y−µ) +Xβk)

= (XW X)−1XTz, pri £emer je ob znanem dejstvu η=Xβ

zi = gi)(yi−µi) α(µi) +ηi.

Ena£ba za izra£un nove β je ocena po metodi najmanj²ih kvadratov iz minimizacije uteºene vsote kvadratov n

∑︂

i=1

wi(zi−Xiβ)2.

Iz tega tudi sledi algoritem IRLS (iteratively re-weighted least squares), ki se upo- rablja z izra£un parametrov. Ta deluje na naslednji na£in:

1. Dolo£imo µˆ =i yii in ηˆi = g(µˆi)). ƒlen δi je navadno enak 0, a lahko dodamo majhno konstanto, da zagotovimo kon£nost ηˆ.

2. Izra£unajmo zi inwi kot zgoraj s trenutnimi vrednostmiµˆi inηˆi. 3. Izra£unajmo βˆ kot minimum uteºene vsote kvadratov

n

∑︂

i=1

wi(zi−Xiβ)2.

Nato dolo£imo nova pribliºka ηˆ =Xβˆ inµˆi =g−1(ηˆi)ter se vrnemo na korak 2.

Konvergenca se navadno obravnava glede na spremembo deviance med posamezni- mim korakoma ter se ustavi, ko je ta dovolj blizu0. Ve£ o sami devianci je razloºeno v razdelku 4.4.1. IRLS je najpogosteje uporabljena numeri£na metoda za iskanje ocene po metodi najve£jega verjetja in je implementirana v mnogih programih za delo z podatki, kot je na primer R. Nekaj ve£ o metodi si bralec lahko prebere v [8].

(29)

3 Posplo²eni aditivni model - GAM

ƒeprav se je posplo²eni linearni model izkazal za zelo uporabnega ter je ²e vedno v uporabi, pa sta Hastie in Tibshiriani leta 1990 v svojem delu Generalized additive models predstavila alternativo. Posplo²eni aditivni modeli so kombinacija aditivnih modelov ter posplo²enih linearnih modelov, zato ohranijo nekatere lastnosti obeh.

Navadno se za opis tega modela uporablja zapis naslednje oblike:

g(µ) = α+f1(x1) +f2(x2) +f3(x3, x4) +... ,

pri £emer velja µ =E(Y), za Y pa velja Y ∼ EF(µ, ϕ), kjer EF(µ, ϕ) predstavlja porazdelitev iz druºine eksponentno porazdeljenih spremenljivk s povpre£jem µ in razpre²enostnim parametrom ϕ. Kot pri GLM tudi tukaj α predstavlja izhodi²£e, zato se ob£asno zamenjuje tudi z β0. Bistvena razlika v primerjavi z posplo²enim linearnim modelom pa je v tem, da odvisnost odxi ni linearna, temve£ je modelirana z razli£nimi funkcijami fi. Te morajo biti zgolj gladke funkcije, kar pa nemudoma predstavlja dve teºavi. Prva je, kako tako funkcijo sploh zapisati, saj njene oblike ne poznamo, druga teºava pa so morebitne omejitve glede njene gladkosti.

3.1 Baza za aproksimacijo

Za laºjo predstavo si poglejmo obravnavo teh teºav na preprostem modelu yi =f(xi) +ϵi,

kjer je yi napovedana spremenljivka, xi napovedovalna spremenjlivka, f neznana gladka funkcija, ϵi pa neodvisna napaka porazdeljena kot N(0, σ2). Ker funkcije f ne poznamo, jo bomo aproksimirali. Za aproksimacijo funkcije bomo potrebovali bazo, torej moramo denirati funkcije, s pomo£jo katerih bomo opisali funkcijo f. Za bazo bomo izbrali funkcije, ki jih poznamo, saj lahko tako opi²emo funkcijo na naslednji na£in

f(x) =

k

∑︂

j=1

bj(x)βj,

kjer bj(x) predstavlja j-to bazno funkcijo. Z izbiro baze potem izbira β postane pravzaprav re²evanje linearnega problema. Prva izbira za bazo bi lahko bila poli- nomska baza. Bazne funkcije so tako b1(x) = 1, b2(x) = x, ..., xn =xn−1. Za neko funkcijo, za katero menimo, da jo lahko opi²emo z polinomom £etrte stopnje takof zapi²emo kot

f(x) = β1+xβ2+x2β3+x3β4+x4β5, s £imer pa na² model postane

yi1+xiβ2+x2iβ3+x3iβ4+x4iβ5i,

kar je pravzaprav linearni model. Polinomi so dobra baza za aproksimacijo pred- vsem, kadar ºelimo aproksimirati v bliºini to£ke z Taylorjevo aproskimacijo. Kadar pa ºelimo funkcijo aproksimirati po celotnem denicijskem obmo£ju, pa polinomska aproksimacija zataji. To lahko vidimo ºe pri preprostih interpolacijah, kjer polinomi

(30)

za£nejo lokalno precej oscilirati. Tako je bolj smiselno, da za bazo izberemo neko bazo, za katero vemo, da dobro aproksimira znane funkcije. Za tako bazo lahko pri£akujemo, da bo tudi dobra za aproksimacije neznanih funkcij. Podobno, £e je neka baza dobra za interpolacijo to£nih podatkov, potem bo zagotovo vsaj dobro izhodi²£e za aproksimacijo podatkov z nekoliko ²uma. Poglejmo si na primer bazo odsekoma linearnih funkcij. Taka baza bo odvisna od izbire delilnih to£k, torej to£k kjer se bosta linearna dela zdruºila. Tem to£kam re£emo vozli²£a in jih ozna£imo z xj: j = 1, ..., k, pri £emer velja xj > xj−1. Tako bo izbrana baza

bj(x) =

⎪⎪

⎪⎪

x−xj−1

xj−xj−1 xj−1 < x≤xj

xi+j−x

xj+1−xj xj < x < xj+1 0 sicer

,

podobno pa deniramo tudi robna primera b1(x) =

{︄ x 2−x

x2−x1 x < x2 0 sicer in

bk(x) =

{︄ x−x

k−1

xk−xk−1 xk−1 < x

0 sicer .

Primer 3.1. Za laºjo predstavo si na sliki 2 poglejmo kak²ne so bazne funkcije na intervalu[0,1]z vozli²£ixi = 0 + 0.2(i−1). Vsaka izmed baznih funkcijbj(x)je torej

Slika 2: Bazni polinomi za odsekoma linearno aproksimacjo.

enaka 0 povsod razen med sosednjima vozli²£ema xj. Pri tem pa od vozli²£a xj−1 linearno nara²£a do xj, nato pa linearno pada do xj+1. Zaradi oblike, ki spominja na obliko ²otora, jim ob£asno pravimo tudi ²otorske funkcije (iz angle²£ine tent function). Aproksimacija funkcije

f(x) = sin(6x) + 2

s pomo£jo baznih teh baznih funkcij za aproksimacijski polinom p(x) je prikazana na sliki 3. Prikazana je funkcija f(x), aproksimacijski polinom p(x) ter vse bazne

(31)

Slika 3: Aproksimicija funkcije f(x) s pomo£jo baznih funkcij bi(x).

funkcijebj(x)pomnoºene z konstanto, ki zagotavlja, da jebj(x)interpolant v delilni to£kixj. S tem, ko je polinomp(x)se²tevek vseh baznih funkcij, je hkrati interpolant funkcije f(x)v vseh delilnih to£kah xj,j = 1, ..., k.

Ob tem pa se moramo zavedati, da praviloma funkcije, ki jo ºelimo aproksimi- rati, ne poznamo. Poglejmo si kako aproksimiramo neznano funkcijo na primeru predstavljenem v viru [8]. Za prikaz bomo uporabili podatke o obrabi motorjev 19 Volvo vozil, ki jih lahko najdemo v R knjiºnjici engine1. Lai£no velja prepri£anje, da se motorji z ve£jo prostornino obrabljajo po£asneje kot motorji z niºjo prostornino.

Poglejmo, kak²ni pa so rezultati glede na podatke. Iz slike 4 ni jasno razvidno, da

Slika 4: Podatki o obrabi 19 Volvo motorjev v odvisnosti od prostornine motorja bi motorji z ve£jo prostornino res imeli niºjo obrabo. Ker funkcije odvisnosti ne poznamo, jo poskusimo aproksimirati z odsekoma linearno funkcijo. Za prvi pri- bliºek vzemimo kar delitev s k = 6, torej s 6 delilnimi to£kami. Aproksimacija na sliki 5 se na prvi pogled zdi ustrezna, a izbira delilnih to£k je bila povsem poljubna.

Prav tako omenimo, da je so to£ke porazdeljene ekvidistan£no in bo tako tudi v preostanku dela, £eprav to ni nujno. Eden izmed na£inov, kako bi izbralik, je da bi

1Podatek je avtor pridobil iz spleta, a stran ni ve£ dostopna. Kljub temu so podatki prikladno urejeni v R knjiºnici gamair.

Reference

POVEZANI DOKUMENTI

Nato se bomo najprej posvetili povpraševanju po električni energiji, kjer bomo izbrali napovedni model in na koncu tudi napovedali porabo električne energije.. Zatem bomo

Prav tako se povečuje nezaupanje do demokracije, do kapitalizma kot tipa ekonomskega sistema in tudi do vseh pred- stavnikov naše države, od političnih elit do državnih

Senat Pedagoške fakultete Univerze v Ljubljani je na seji, dne 07.10.2010 obravnaval pritožbe rednih in izrednih študentov z negativno rešenimi prošnjami za vpis v višji letnik

Vesni se zdi dobro sodelovanje s terapevtskim parom ključnega pomena. Povedala je, da je zelo pomembno, da ima vodnik terapevtskega psa ustrezen pristop do izvajanja terapij.

Vetrna energija, vetrne elektrarne, učni načrt, induktivne metode, raziskovalno učenje, izdelava vetrnice... Introducing topisc on wind energy

Predstavljen je okviren načrt za samoizgradnjo preprostega oddaljenega laboratorija s cenovno dostopno opremo, ki preko kratkih sporočil (SMS) uporabnika obvešča

V tem podpoglavju bomo pregledali vsa dosedanja preverjanja, objavljena na spletni strani državnega izpitnega centra. Naloga je I taksonomske stopnje po Bloomu,

Tako kot ostali situacijski modeli, tudi ta model ne nudi recepta za najboljše vodenje, temveč temelji na predpostavki, da mora uspešni vodja izbrati ustrezen način vodenja