• Rezultati Niso Bili Najdeni

UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Finan£na matematika  1. stopnja Sabrina Calcina

N/A
N/A
Protected

Academic year: 2022

Share "UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Finan£na matematika  1. stopnja Sabrina Calcina"

Copied!
34
0
0

Celotno besedilo

(1)

UNIVERZA V LJUBLJANI

FAKULTETA ZA MATEMATIKO IN FIZIKO Finan£na matematika 1. stopnja

Sabrina Calcina

Preºivetvena analiza za sr£noºilne bolezni

Delo diplomskega seminarja Mentor: izr. prof. dr. Jaka Smrekar

Ljubljana, 2021

(2)

Kazalo

Slike 2

1. Uvod 4

2. Preºivetvena funkcija in tveganje 5

2.1. Pomembne zveze v analizi preºivetja 6

3. Krnjenje 9

3.1. Desno krnjenje 9

4. Funkcija verjetja 10

4.1. Funkcija verjetja pri konstantnem krnjenju 10

4.2. Funkcija verjetja v splo²nem 11

5. Parametri£ni regresijski modeli 13

5.1. Weibullova porazdelitev (γ, λ) 14

6. Podatki 16

7. Statisti£ne metode za delo s podatki 18

7.1. Krnjenje podatkov 18

7.2. Weibullova porazdelitev(γ, λ) 18

8. Rezultati in ugotovitve 20

8.1. Kajenje in deleº umrlih 20

8.2. Holesterol in deleº umrlih 21

8.3. Sistoli£ni krvni tlak (SBP) in deleº umrlih 21

8.4. Desetletno tveganje in kajenje 22

8.5. Desetletno tveganje in holesterol 23

8.6. Desetletno tveganje ob spremembi SBP 24

9. Primerjava z razpredelnicami tveganj score 26

10. Priloge 28

Slovar strokovnih izrazov 34

Literatura 34

Slike

1 Krivulja preºivetja. 5

2 Graf funkcije fW(w) = ew−ew. 14

3 Desetletno tveganje za sr£noºilne bolezni s smrtnim izidom, izra£unano s

pomo£jo Weibullovega regresijskega modela. 25

4 Desetletno tveganje za sr£noºilne bolezni s smrtnim izidom v regijah z

visokim tveganjem v Evropi SCORE. (R.M. Conroy, 2003) 26 5 Desetletno tveganje za sr£noºilne bolezni s smrtnim izidom v regijah z

nizkim tveganjem v Evropi SCORE. (R.M. Conroy, 2003) 27

(3)

Preºivetvena analiza za sr£noºilne bolezni Povzetek

Sr£noºilne bolezni so v razvitem delu sveta najpogostej²i vzrok obolevnosti in umr- ljivosti odraslih. Sr£ni infarkt in moºganska kap, ki sta nenadna zapleta bolezni moºganskega ºilja, povzro£ata najve£ smrti in dolgotrajnih posledic. Z zdravim na£inom ºivljenja lahko zaplete zaradi sr£noºilnih bolezni uspe²no omejimo in po- dalj²amo ºivljenjsko dobo. Najpogostej²i dejavniki tveganja so zvi²an krvni tlak, zvi²an holesterol, kajenje in telesna neaktivnost. Tveganje se razlikuje med spoloma in nara²£a s starostjo. Zdravniki na podlagi razpredelnic s tveganji, izra£unanih z upo²tevanjem omenjenih dejavnikov, ocenjujejo tveganja za sr£noºilne bolezni s smrtnim izidom za svoje paciente. V primeru visokih ocen priporo£ajo spremembo na£ina ºivljenja. V diplomskem delu smo s pomo£jo Weibullovega regresijskega mo- dela pridobili ocene tveganj za smrt glede na glavne dejavnike. Uporabljeni podatki izhajajo iz prvega dela znane kohortne Framinghamske ²tudije o sr£nih boleznih.

Posamezniki so bili v ²tudiji opazovani najve£ 32 let ali do njihove smrti, zato smo podatke desno nekonstantno krnili.

Povzetek v angle²£ini Abstract

Cardiovascular diseases are the most common cause of adult morbidity and morta- lity in the developed part of the world. Heart attack and stroke, which are sudden complications of cerebrovascular diseases, cause the most deaths and long-term con- sequences. Healthy lifestyle can successfully limit complications from cardiovascular diseases and prolong life. The most common risk factors are high blood pressure, high cholesterol, smoking and physical inactivity. The risk varies between the sexes and increases with age. Risk tables, calculated to estimate risk of death from car- diovascular diseases, are commonly used in medical profession. In case of high risk doctors recommend a change in lifestyle. In this work, we estimated these risks with the Weibull regression model. The data come from the rst part of well known cohort Framingham study of heart disease. Individuals were observed in the study for a maximum of 32 years or until their death, so the data are right non-constantly censored.

Math. Subj. Class. (2020): 62P10.

Klju£ne besede: Preºivetvena analiza, sr£noºilne bolezni, Weibullova porazdelitev.

Keywords: Survival analysis, cardiovascular disease, Weibull distribution.

(4)

1. Uvod

Analiza preºivetja je veja statistike, ki analizira pri£akovano trajanje dokler se ne zgodi eden ali ve£ dogodkov. Na primer smrt v biolo²kih organizmih ali okvara v mehanskih sistemih.

ƒas preºivetja lahko na splo²no deniramo kot £as do nastopa danega dogodka.

Ta dogodek je lahko razvoj bolezni, odziv na zdravljenje, ponovitev ali smrt. Po- datki o preºivetju lahko vklju£ujejo £as preºivetja, odziv na dolo£eno zdravljenje in zna£ilnosti bolnika, povezane z odzivom, preºivetjem in razvojem bolezeni.

ƒe bi bil £as preºivetja vseh preiskovancev natan£en in znan, bi bila analiza podat- kov o preºivetju bistveno bolj enostavna. Vendar porazdelitev preºivetja pogosto ni znana, zato je pomemben del preºivetvene analize prilagajanje modela. Ko je stati- sti£ni model ustrezno sestavljen, lahko parametre ocenimo z analiti£nimi metodami.

V primeru analiziranja preºivetja glede na neko bolezen nam pridobljene informacije pomagajo pri napovedovanju preºivetja in pri razvoju optimalne sheme zdravljenja.

Posebna zna£ilnost podatkov je, da nekateri predmeti v ²tudiji niso doºiveli obrav- navanega dogodka v £asu opazovanja in so na primer ²e ºivi ali pa brez bolezni.

Natan£en £as preºivetja teh oseb tako ni znan. Imenujemo jih krnjena opazovanja.

ƒe opazovanja niso krnjena, pa je sklop £asov preºivetja popoln.

V diplomskem delu se bomo posvetili napovedovanju tveganja smrti zaradi sr£- noºilnih bolezni. Ogledali si bomo tveganje danes in £ez 10 let. To bomo storili na podlagi Weibullovega modela. Za vsakega posameznika nas bodo zanimale pojasnje- valne spremenljivke, ki so v na²em primeru starost, kajenje, holesterol in sistoli£ni krvni tlak.

(5)

2. Preºivetvena funkcija in tveganje

Porazdelitev preºivetja najpogosteje opisujemo z eno od treh funkcij: preºivetvena funkcija, gostota verjetnosti in funkcija tveganja. Vse tri funkcije so med seboj ek- vivalentne. ƒe poznamo eno, lahko izpeljemo drugi dve.

Naj bo T zvezna slu£ajna spremenljivka z gostoto verjetnosti f(t). T predstavlja

£as preºivetja in je po dogovoru nenegativna.

Denicija 2.1. Kumulativna funkcija porazdelitveF(t)slu£ajne spremenljivke T je denirana kot

F(t) = P(T ≤t) = Z t

0

f(x) dx.

Denicija 2.2. Preºivetvena funkcija slu£ajne spremenljivkeT je denirana kot verjetnost, da posameznik ºivi dlje od £asat. Ozna£imo jo S(t). Preºivetvena funk- cija je komplementarna kumulativna porazdelitvena funkcija, torej je po deniciji

S(t) = P(posameznik ºivi dlje od t)

=P(T > t)

= 1−P(T ≤t)

= 1−F(t)

= Z

t

f(x)dx.

Preºivetveno funkcijo imenujemo tudi kumulativna stopnja preºivetja. Je nena- ra²£ajo£a zvezna funkcija z lastnostma

S(0) = 1 ter

t→∞lim S(t) = 0.

Gra£na predstavitev

Za upodabljanje poteka preºivetja uporabljamo gra£no predstavitev, ki jo imenu- jemo krivulja preºivetja. Strma krivulja preºivetja prikazuje nizko stopnjo preºive- tja, £e je krivulja bolj poloºna, prikazuje visoko stopnjo preºivetja. To vidimo na spodnji sliki.

Slika 1. Krivulja preºivetja.

Na primeru tako vidimo, da ima tip 1 (£lovek) visoko stopnjo preºivetja, saj na za£etku preºivi veliko organizmov. Pri tipu 3 (ºabe) pa veliko organizmov umre kmalu po samem za£etku, torej je stopnja preºivetja nizka.

(6)

Gostota verjetnosti

Ker je £as zvezen lahko predpostavimo, da je slu£ajna spremenljivka T absolutno zvezna glede na Lebesguovo mero, torej obstaja gostota verjetnosti glede na Le- besguovo mero. Njeno vrednost v £asu t lahko podamo kot limito verjetnosti, da posameznik umre v kratkem intervalu med t int+ ∆t na enoto ∆t. Enostavneje bi to opisali kot verjetnost, da posameznik umre v kratkem £asovnem intervalu deljeno z dolºino intervala. Torej velja

f(t) = lim

∆t→0

P(posameznik umre v £asu med t int+ ∆t

∆t ,

kjer limita obstaja.

Graf gostote verjetnosti f(t) imenujemo krivulja gostote.

Funkcija tveganja

Funkcija tveganja λ(t) £asa preºivetja T prikazuje pogojno stopnjo smrti. Deni- ramo jo kot verjetnost smrti v zelo majhnem £asovnem intervalu, ob predpostavki, da je posameznik preºivel do za£etka intervala. To je limita verjetnosti, da je po- sameznik umrl v zelo kratkem intervalu (t, t+ ∆t), pogojno na to, da je do £asa t preºivel. To pomeni

(1) λ(t) = lim

∆t→0

P(T ∈[t, t+ ∆t)|T ⩾t)

∆t .

Funkcijo tveganja imenujemo tudi trenutna stopnja okvare, sila smrtnosti, po- gojna stopnja umrljivosti ali speci£na stopnja neuspeha.

(E. T. Lee, J. Wenyuwang, 2003) 2.1. Pomembne zveze v analizi preºivetja

V prej²njem razdelku smo ºe denirali funkcije, katere uporabljamo pri analizi preºivetja. V tem poglavju bomo spoznali zveze med njimi.

Slu£ajna spremenljivka T predstavlja £as, dokler se ne zgodi opazovan dogodek.

V tem delu uporabljamo £as preºivetja. Na² opazovan dogodek imenujemo kar smrt kljub temu, da v splo²nem to ni edina moºnost, ki jo lahko preu£ujemo.

Denicija 2.3. Naj bo T slu£ajna spremenljivka s pripadajo£o funkcijo gostote f(t), kumulativno porazdelitveno funkcijoF(t)ter funkcijo preºivetjaS(t). Funkcijo tveganja lahko izrazimo s funkcijami f(t) inS(t)in tako dobimo naslednjo zvezo:

(2) λ(t) = f(t)

S(t), ki velja skoraj povsod.

(7)

Zvezo (2) izpeljemo iz ena£be (1) na naslednji na£in

λ(t) = lim

∆t→0

P(T ∈[t, t+ ∆t)|T ⩾t)

∆t

= lim

∆t→0

P(T ∈[t, t+ ∆t)∩T ⩾t)

∆t·P(T ⩾t)

= 1

P(T ⩾t) · lim

∆t→0

P(T ∈[t, t+ ∆t))

∆t

= f(t) S(t).

Pri tem v prehodu iz druge v tretjo vrstico upo²tevamo, da je

{T ∈[t, t+ ∆t)} ⊂ {T ⩾t}.

Naslednjo zvezo dobimo iz ena£be (2):

λ(t) = d dt

Z t 0

f(x) S(x)dx

= d dt

Z t 0

f(x) 1−F(x)dx

= d dt

Z F(t) F(0)

1 1−udu

= d dt

−ln(1−F(t)) +ln(1−F(0)) .

Tu smo pri prehodu iz druge v tretjo vrstico za novo spremenljivko vzeli

u=F(x). Zamenjavo spremenljivke lahko naredimo, ker jeF(x)strogo nara²£ajo£a funkcija. Vemo, da je f(x) odvod kumulativne porazdelitvene funkcije F(x) ter F(0) = 0. Sledi

λ(t) =−d

dtln(1−F(t))

=−d

dtln(S(t)).

ƒe re²imo diferencialno ena£bo na funkcijo S(t)in upo²tevamoS(0) = 1, dobimo

S(t) = eR0tλ(x) dx.

(8)

Denicija 2.4. Kumulativno tveganje ob £asu t je integral funkcije tveganja do

£asa t, ki ga deniramo kot

Λ(t) = Z t

0

λ(x) dx.

Denicija 2.5. Pri£akovana ºivljenjska doba. Naj µozna£uje pri£akovano vre- dnost slu£ajne spremenljivke T s pripadajo£o funkcijo gostote f(t) in funkcijo pre- ºivetja S(t). Po deniciji pri£akovane vrednosti velja

(3) µ=

Z 0

xf(x) dx.

Pri£akovano ºivljensko dobo lahko izra£unamo tudi kot integral funkcije preºivetja in sicer

µ= Z

0

S(x) dx.

Kar izpeljemo iz ena£be (3) tako da integriramo po delih, pri £emer je u =x ter dv =f(x)dx. Poleg tega vemo, da je integral funkcije f(x) enak −S(x), S(0) = 1 ter S(∞) = 0. Dobimo

µ= (−x·S(x))

0

− Z

0

(−S(x))dx

=−∞ ·S(∞) + 0·S(0) + Z

0

S(x)dx

= Z

0

S(x)dx.

(G. Rodríguez, 2007)

(9)

3. Krnjenje

Do krnjenja pride, ko ne poznamo celotnega preºivetvenega £asa posameznika.

V nekaterih primerih se ²tudija ºe kon£a, a za nekatere posameznike nismo opazili dogodka. Pravimo, da je bil posameznikov preºivetveni £as krnjen. Vemo, da je bil

£as preºivetja posameznika dalj²i od obdobja, v katerem smo ga opazovali, ne vemo pa njegovega celotnega preºivetvenega £asa.

Obstajajo razli£ne kategorije krnjenj: desno, levo in intervalno krnjenje. V na- daljevanju se bomo posvetili desnemu krnjenju. Za ustrezno obravnavanje krnjenja moramo razmisliti o na£rtu, ki je bil uporabljen za pridobitev podatkov o preºivetju.

3.1. Desno krnjenje

Pri desnem krnjenju dogodek opazujemo samo, £e se pojavi pred dolo£enim £a- som. Tipi£no klini£no preizku²anje se za£ne z dolo£enim ²tevilom bolnikov, ki jim je zdravljenje namenjeno. Zaradi omejenega £asa ali stro²kov bo preiskovalec ²tudijo kon£al, preden bodo vsi bolniki doºiveli obravnavan dogodek. V tem primeru imajo vsa krnjena opazovanja £as nastanka dogodka enaka kar dolºini ²tudije.

Pri desnem krnjenju uporabimo naslednji zapis. Naj boX = (X1, . . . , Xn)vektor ºivljenskih dob in naj Xi predstavlja ºivljenjsko dobo i-tega posameznika. Naj bo

²e Cr = (Cr1, . . . , Crn) vektor morebitenih £asov krnjenja, kjer nam Cri pove, ali je preºivetveni £as posameznika i krnjen ali ne. Po predpostavki so Xi neodvisni in enako porazdeljeni z gostoto f(x)in preºivetveno funkcijo S(x). Natan£na ºivljenj- ska doba posameznika bo znana, £e in samo £e je X manj²i ali enak Cr. ƒe je X ve£ji od Cr, je posameznik preºivel in je £as njegovega dogodka krnjen na Cr.

Podatke lahko predstavimo s pari slu£ajnih spremenljivk (T, δ), kjer δ ozna£uje, ali ºivljenjska doba ustreza dogodku (v tem primeru je δ = 1), ali pa je krnjena (δ = 0). T je tako enak X, £e je celotna ºivljenjska doba opazovana in enak Cr, £e je krnjena:

T =min(X, Cr).

Poznamo ²e druge oblike krnjenja. Lo£imo desno krnjenje tipa 1 in tipa 2.

Tip 1 je, kadar posamezniki vstopajo v ²tudijo ob razli£nih £asih in je kon£na to£ka v naprej dolo£ena s strani preiskovalca tako, da so £asi krnjenja znani ºe, ko posameznik vstopa v ²tudijo. V takih ²tudijah imajo posamezniki svoj speci£en, ksen £as krnjenja. Priro£en prikaz tak²nih podatkov je, da za£etni £as vsakega posameznika premaknemo na 0.

Pri tipu 2 se ²tudija nadaljuje do neuspeha prvih r posameznikov. Poskusi, ki vklju£ujejo ta tip, se pogosto uporabljajo pri preizku²anju ºivljenske dobe opreme.

’tudija se zaklju£i, ko r od n predmetov odpove. Tak na£in preizkusa prihrani £as in denar, saj bi preizkus lahko sicer trajal zelo dolgo, da bi vsi predmeti odpovedali.

(10)

4. Funkcija verjetja

Preden sploh govorimo o funkciji verjetja moramo privzeti, da sta ºivljenjska doba in £as krnjenja neodvisna. Ko konstruiramo funkcijo verjetja, moramo biti pozorni na to, kak²ne informacije nam dajo posamezna opazovanja.

Naj bo Cr od X neodvisna slu£ajna spremenljivka s preºivetveno funkcijo SG(c), kumulativno funkijo G(c) in gostoto g(c) glede na σ-kon£no meroβ na B(R). Pri- vzemimo ²e, da ima X gostoto f(x) glede na Lebesguovo mero. Ozna£imo sedaj preºivetveno funkcijo slu£ajne spremenljivke X sSF(x). Ker sta X inCr neodvisni, ima X produktno mero glede na ν. Velja

f(X,Cr)(x, c)dν(x, c) =f(x)g(c)dxdβ(c).

Naj bo n ²tevilo posameznikov ter (ti, δi)par za vsakega posameznika, torej za vsak i= 1, . . . , n.

4.1. Funkcija verjetja pri konstantnem krnjenju

Funkcijo verjetja za tip 1 desnega krnjenja skonstruiramo na slede£ na£in. Naj- prej potrebujemo porazdelitev slu£ajnega vektorja(T,∆). Opazimo, daT in∆nista neodvisni slu£ajni spremenljivki.

Lo£iti moramo ²tiri primere: t ≥Cr, t≤Cr, δ = 0 inδ = 1. Najprej si oglejmo za t≥Cr inδ= 0. Dobimo

(4)

P(T ≤t, δ = 0) =P(T ≤t|δ= 0)P(δ = 0) =

=P(Cr≤t|X > Cr)P(X > Cr) =

=P(X > Cr)

=S(Cr),

saj vemo, da jeP(Cr ≤t|X > Cr) = 1. Ko boδ= 1je verjetnost dogodka enaka 0.

Nato si oglejmo t < Cr. V primeru, δ = 0, bo tako kot zgoraj to dogodek z verjetnostjo 0. Za δ= 1 pa dobimo

(5)

P(T ≤t, δ = 1) =P(T ≤t|δ = 1)P(δ= 1)

=P(X≤t|X ≤Cr)P(X ≤Cr)

= P(X ≤t∩X ≤Cr)

P(X ≤Cr) P(X ≤Cr)

=P(X≤min(t, c)).

(11)

4.2. Funkcija verjetja v splo²nem

V primeru ∆ = 0bo Kt obmo£je, kjer je 0≤c < x in 0≤c≤t in

P(T ≤t,∆ = 0) =P(T ≤t, X > Cr)

=P(Cr ≤t, X > Cr)

= Z Z

Kt

f(X,Cr)(x, c)dν(x, c)

= Z Z

Kt

f(x)g(c)dxdβ(c)

= Z

[0,t]

Z

(c,∞)

f(x)dx

!

g(c)dβ(c)

= Z

[0,t]

SF(c)g(c)dβ(c).

(6)

V primeru ∆ = 1je Lt obmo£je, kjer je 0≤x≤c in0≤x≤t in P(T ≤t,∆ = 1) =P(T ≤t, X ≤Cr)

=P(X ≤t, X ≤Cr)

= Z Z

Lt

f(X,Cr)(x, c)dν(x, c)

= Z Z

Lt

f(x)g(c)dβ(c)dx

= Z

[0,t]

Z

[x,∞)

g(c)dβ(c)

!

f(x)dx

= Z

[0,t]

f(x) 1−G(x) (7) dx

= Z

[0,t]

f(x)SG(x)dx.

(8)

Pri prehodu iz (7) v (8) smo upo²tevali, da ima mnoºica to£k nezveznosti kumu- lativne funkcije Lebesguovo mero 0. Torej je skoraj povsod G(x) =G(x).

Gostota za (t,∆) glede na σ-kon£no mero ω na B(R2)

Naj bosta A ⊂ R in B ⊂ R Borelovi mnoºici in L Lebesguova mera. Najprej si oglejmo mero ω(A×B)za na² konkretni primer. Lo£imo 4 moºnosti.

ω(A×B) =









0, £eB∩ {0,1}=∅, L (A), £eB∩ {0,1}={1}, β (A), £eB∩ {0,1}={0}, L(A) +β (A), £e {0,1} ⊂B.

Da mera ω(A×B)obstaja, se zlahka prepri£amo s pomo£jo Carathéodoryjevega raz²iritvenega izreka.

(12)

Gostota glede na σ-kon£no mero ω je

f(t, δ) =





0, £e δ /∈ {0,1}, f(x)SG(x), £e δ= 1, SF(c)g(c), £e δ= 0.

Posamezne dele smo ºe izpeljali in sicer pri ena£bah (6) in (7).

Funkcija verjetja za vzorec velikosti n je enaka L=

n

Y

i=1

f(ti, δi).

Funkcija verjetja za slu£ajen vzorec parov (ti, δi), i= 1, . . . , nje tako enaka L=

n

Y

i=1

[f(ti)SG(ti)]δi[g(ti)SF(ti)]1−δi

=Yn

i=1

SG(ti)δig(ti)1−δiYn

i=1

f(ti)δiSF(ti)1−δi (9) .

Iz splo²nega v konstantno desno krnjenje

Prepri£ajmo se, da dobljeno res posplo²uje tudi primer konstantnega desnega krnje- nja. V primeru, ko uporabimo konstantno desno krnjenje, bosta £as krnjenja in prvi izmed oklepajev ena£be (9) konstantna. ƒe se naveºemo na ena£bo (6), v primeru

∆ = 0,

Z

[0,t]

SF(x)g(c)dβ(c),

vemo, da bo v primeru, ko je β Diracova mera pomembno le, kje je mera skon- centrirana. To vemo, da bo v to£ki krnjenja, zato bo zgornji integral v tem primeru enak S(Cr), kar se sklada z ºe omenjeno ena£bo (4).

V primeru ∆ = 1si oglejmo ena£bo (7), Z

[0,t]

f(x) 1−G(x) dx.

V tem primeru imamo Lebesguovo mero in jo zato po osnovnem izreku analize (oziroma izrekih o odvajanju mer) odvajamo ter dobimo f(ti). To smo izpeljali tudi v ena£bi (5). Rezultata se skladata.

Funkcija verjetja pri konstantnem krnjenju je tako enaka L=

n

Y

i=1

[f(ti)]δi[SF(Cr)]1−δi.

(K. Dietz, M. Gail, K. Krickeberg, J. Samet, A. Tsiatis, 2003)

(13)

5. Parametri£ni regresijski modeli

Denicija 5.1. Naj bo X £as nastanka dogodka in Z vektor pojasnjevalnih spre- menljivk. V modelu pospe²enega £asa je funkcija preºivetja z vektorjem poja- snjevalnih spremenljivkZ v £asuxenaka funkciji preºivetja v normalnem modelu v

£asu xe⟨Θ,Z⟩, kjer je Θ = (θ1, . . . , θp) vektor regresijskih koecientov.

Model pospe²enega £asa deniramo tudi kot

S(x|Z) = S0(e⟨Θ,Z⟩x) za vse x.

Denicija 5.2. Funkcijo e⟨Θ,Z⟩imenujemo faktor pospe²ka. Pove nam kako spre- memba pojasnjevalnih spremelljivk spremeni izhodi²£no £asovno lestvico.

Model pospe²enega £asa je povezava med stopnjo tveganja za posameznika s po- jasnjevalnimi spremenljivkami Z in izhodi²£no stopnjo tveganja:

λ(x|Z) = e⟨Θ,Z⟩λ0(e⟨Θ,Z⟩x), za vse x.

Denicija 5.3. Navaden linearni model za logaritmiran £as deniramo kot Y =lnX =µ+⟨γ, Z⟩+σW,

kjer je γ = (γ1, . . . , γp) vektor regresijskih koecientov in W porazdelitev napak.

Smiselno lahko uporabljamo in nastavljamo σW za modeliranje odstopanja v regre- sijskem modelu.

Oba omenjena modela sta tesno povezana. ƒe jeS0(x)funkcija preºivetja slu£ajne spremenljivkeeµ+σW, potem je linearni model logaritmiranega £asa ekvivalenten mo- delu pospe²enega £asa okvare s Θ = −γ.

Poglejmo si bolj podrobno:

P(eµ+σW > x) =S0(x).

ƒe namesto x sedaj vzamemo xe⟨θ,Z⟩ dobimo:

P(eµ+σW > xe⟨θ,Z⟩) = S0(xe⟨θ,Z)

P(eµ+σW−⟨θ,Z⟩ > x) =S0(xe⟨θ,Z⟩)

P(µ+σW − ⟨θ, Z⟩> ln(x)) =S0(xe⟨θ,Z⟩).

To bi bilo ekvivalentno modelu pospe²enega £asa, £e bi namesto θ vzeli −γ.

(14)

5.1. Weibullova porazdelitev (γ, λ)

Weibullova porazdelitev je zelo prilagodljiv parametri£en model. Graf funkcije tveganja je bodisi monotono nara²£ajo£ bodisi monotono padajo£ bodisi konstan- ten. To je edini model parametri£ne regresije, ki ga lahko predstavimo tako v obliki proporcionalnega tveganja, kot tudi v obliki pospe²enega £asa.

Preºivetvena funkcija Weibullove porazdelitve je podana kot

S0(x) =e−λxγ, funkcija tveganja pa kot

λ0(x) = λγxγ−1.

ƒe ima X Weibullovo preºivetveno funkcijo, ima Y =lnX preºivetveno funkcijo

SY(y) =e−λeγy.

ƒe sta µ in σ dolo£ena z zvezama λ =eµσ in σ = 1/γ, ima Y isto porazdelitev kot µ+σW, kjer ima W porazdelitev ekstremnih vrednosti z gostoto

fW(w) =ew−ew in preºivetveno funkcijo

SW(w) = e−ew.

GraffW(w)je sicer nenavadne oblike, £e ga primerjamo z grafom gostote normalne porazdelitve, saj graf ni simetri£en. Parameter σ je v spodnjem primeru ve£ji in s tem je ve£ja disperzija.

Slika 2. Graf funkcije fW(w) = ew−ew.

(15)

Gostota verjetnosti in funkcija preºivetja za Y sta enaki fY(y) = (1/σ)e(y−µ)/(σ−e(y−µ)/σ) in

SY(y) = e−e(y−µ)/σ.

Ko je γ = 1 (σ = 1), potem je Weibullova porazdelitev enaka eksponentni poraz- delitvi.

Za vklju£itev spremenljivk v Weibullov model uporabljamo linerni model za lo- garitmiran £as

Y =µ+⟨γ, Z⟩+σW, od koder sledi

S(X|Z)(x|z) =S0(xe⟨θ,z⟩) in

S(Y|Z)(y|z) =S0(eye⟨θ,z⟩).

Poglejmo si ²e funkcijo verjetja, s katero bomo v nadaljevanju ra£unali.

Uporabimo v bistvu (9), vendar tu ne gre za neodvisne aplikaije iste slu£ajne spre- menljivke, ampak za pogojne porazdelitve, vsaki£ na svoje vrednosti pojasnjevalnih spremenljivk, kot je to obi£ajno pri regresiji. Natan£nejeS(X|Z)(x|zi)je preºivetvena funkcija slu£ajne spremenljivkeX pogojno naZ =zi inf(X|Z)(x|zi)je njena gostota oblike

f(X|Z)(x|zi) = λγxγ−1e⟨β,zi⟩−λxγeβ,zi, kjer je β vektor regresijskih koecientov.

Funkcija verjetja je oblike

L=Yn

i=1

SG(ti)δig(ti)1−δiYn

i=1

f(X|Z)(ti|zi)δiS(X|Z)(ti|zi)1−δi .

Ker je Qn

i=1SG(ti)δig(ti)1−δi

neodvisen od parametrov, bomo v nadaljevanju maksimizirali

(10) L=

n

Y

i=1

f(X|Z)(ti|zi)δiS(X|Z)(ti|zi)1−δi. (K. Dietz, M. Gail, K. Krickeberg, J. Samet, A. Tsiatis, 2003)

(16)

6. Podatki

Podatki, uporabljeni v diplomskem delu, izvirajo iz znane kohortne Framingham- ske ²tudije kjer so opazovali 5209 posameznikov. Kohorta je kolektivni izraz, ki se uporablja za ljudi z neko skupno lastnostjo. Najpogosteje se uporablja v razisko- valnih kontekstih, zgodovinsko je opisoval skupino vojakov.

Opazovane spremenljivke iz podatkov so:

lexam - zadnji pregled posameznika v ²tudiji. ƒe je posameznik preºivel ima vre- dnost 16.

surv - preºivetje posameznika. Z 0 ozna£imo tiste posameznike, ki so bili v £asu 16. pregleda ²e ºivi, z 1 pa tiste, ki so umrli pred 16. pregledom.

cause - vzrok smrti: lo£imo 8 moºnosti.

• 0 = preºivel

• 1 = nenadna smrt zaradi koronarne bolezni srca (CHD)

• 2 = smrt zaradi druge koronarne sr£ne bolezni

• 3 = smrt zaradi moºganske kapi (CVA)

• 4 = smrt zaradi cerebralne vaskularne bolezni

• 5 = smrt zaradi raka (CA)

• 6 = drug vzrok smrti

• 9 = neznan vzrok

cexam - pregled pri katerem je bila prvi£ diagnosticirana koronarna bolezen srca.

’tevila od 1 do 16 ozna£ujejo pregled v katerem je bil CHD diagnosticiran, z 0 ozna-

£imo posameznika, ki mu nikoli niso diagnosticirali CHD.

chd - smrt zaradi koronarne bolezni srca. Z 1 ozna£imo smrt zaradi vzrokov 1 in 2, z 0 pa £e je posameznik preºivel ali pa umrl zaradi drugih vzrokov.

cva - smrt zaradi bolezni srca ali oºilja. Z 1 ozna£imo smrt zaradi vzrokov 3 in 4, z 0 pa, £e je posameznik preºivel ali pa umrl zaradi drugih vzrokov.

ca - smrt zaradi raka. ƒe je posameznik umrl zaradi vzroka 5, to ozna£imo z 1.

ƒe je posameznik preºivel oziroma umrl zaradi drugih vzrokov pa z 0.

oth - smrt zaradi drugih bolezni kot CHD. ƒe je posameznik umrl zaradi vzro- kov od 3 do 9, to ozna£imo z 1. ƒe je posameznik preºivel ali umrl zaradi CHD pa z 0.

sex - spol posameznika. Z 1 ozna£imo mo²kega, z 2 ºensko.

age - starost posameznika na prvem pregledu. Od 28 do 62 let.

ht - vi²ina posameznika. Od 51,5 do 76,5 palcev na prvem pregledu. ƒe podatek manjka, to ozna£imo z -1.

(17)

wt - teºa posameznika. Od 67 do 300 kg na prvem pregledu. ƒe podatek manjka, to ozna£imo z -1.

scl1 - serumski holesterol posameznika na prvem pregledu in sicer v enotah mg/100ml.

scl2 - serumski holesterol posameznika na drugem pregledu in sicer v enotah mg/100ml.

dbp - diastoli£ni krvni tlak posameznika na prvem pregledu v vrednostih od 50 do 160 mmHg.

sbp - sistoli£ni krvni tlak posameznika na prvem pregledu v vrednostih od 82 do 300 mmHg.

smok - koli£ina skajenih cigaret na dan. ƒe podatek manjka, to ozna£imo z -1.

Nove, dodane spemenljivke so:

death_cardiov - smrt zaradi sr£noºilnih bolezni. Zdruºeni opazovani spremenljivki cva in chd. ƒe je posameznik umrl zaradi vzroka 1,2,3 ali 4, to ozna£imo z 1. ƒe je posameznik preºivel oz. umrl zaradi drugih vzrokov pa z 0.

hol - serumski holesterol posameznika scl1 in scl2 v enotah mmol/Lzdruºimo.

Zdruºili smo po principu, da £e eden izmed holesterolov ni bil podan smo uporabili drugega, £e ni bilo podatka pri obeh smo posameznika odstranili, in kon£no v pri- meru, da smo imeli oba podatka vzeli tehtano povpre£je le teh.

smoke - popravljena spremenljivka kajenja in sicer 0 v primeru, da posameznik ne kadi in 1 v primeru, ko skadi 1 cigareto ali ve£ na dan.

ITM - indeks telesne mase posameznika. Izra£unan kot vi²ina(v kg) teºa(v m)2 .

death_other - £e je drugi vzrok smrti kot sr£noºilne bolezni ozna£imo z 1, sicer z 0.

Spremenljivke, katere bomo v nadaljevanju uporabljali so torej

lexam, surv, cexam, sex, age, sbp, smoke, hol, death_cardiov in death_other.

Ostale smo odstranili.

(18)

7. Statisti£ne metode za delo s podatki

Opazovane spremenljivke so bile starost posameznika, njegov holesterol, sistoli£ni krvni tlak in aktivnost kajenja. Obstaja ve£ sr£noºilnih bolezni, ki prizadenejo krvne ºile. ’tudija se je osredoto£ala na koronarno sr£no bolezen (chd), pri kateri gre za zoºenje ven£nih arterij s posledi£no slab²o prekrvavitvijo sr£ne mi²ice, ter cerebro- vaskularno bolezen (cva), to je bolezen moºganskega ºilja (vklju£no z moºgansko kapjo). V na²em delu teh dveh bolezni ne bomo lo£evali. Opazovali bomo torej skupno tveganje za vse bolezni srca in oºilja. Mo²ke in ºenske bomo lo£ili zaradi velikih razlik v rezultatih glede na spol.

7.1. Krnjenje podatkov

Posamezniki v primeru na²e ²tudije vstopajo v ²tudijo ob slu£ajnem £asu. V

²tudiji so opazovani najve£ 32 let ali do dogodka smrti, torej imamo zvezno ne- konstantno desno krnjenje. Vsakemu posamezniku pred za£etkom od²tejemo 20 let.

Slu£ajna spremenljivka X predstavlja £as nastanka opazovanega dogodka posame- znika, v na²em primeru smrt, Cr pa je £as krnjenja, ki je enak

Cr =starost, ko je posameznik vstopil v ²tudijo+ 32 let−20 let.

Slu£ajna spremenljivka T je enaka T =min(X, Cr).

7.2. Weibullova porazdelitev(γ, λ)

Najprej s funkcijama ConvertWeibull in survreg v programu R pridobimo parame- tre za Weibullovo porazdelitev in sicer λ in γ. Regresijski koecienti, ki nastopajo ob pojasnjevalnih spremenljivkah sbp, hol in smoke so enaki β= (β1, β2, β3).

Funkciji maksimizirata funkcijo verjetja (10) opisano v poglavju 5.1., preºivetvena funkcija pa je oblike

S(X|Z)(x|z) = e−λxγe⟨β,Z⟩. Za mo²ke tako dobimo:

β = (0.02035,0.18484,0.41519), λ= 1.427∗10−11, γ = 5.7287, za ºenske pa:

β = (0.01386,0.11932,0.47141), λ= 1.579∗10−13, γ = 6.6612.

Verjetnost preºivetja posameznika pri to£no dolo£eni starosti izra£unamo s preºi- vetveno funkcijo

S0(starost) =e−λ(starost−20)γ

,

upo²tevati moramo ²e tehtano vsoto wdejavnikov tveganja holesterola, sistoli£nega krvnega tlaka in kajenja z uporabo prej izra£unanih koecientov:

w=βhol(hol−6) +βSBP(SBP−120) +βsmoke(smoke).

(19)

Kon£na preºivetvena funkcija posameznika pri to£no dolo£eni starosti z upo²te- vanimi faktorji tveganja je

S(starost) = (S0(starost))ew.

Desetletna verjetnost preºivetja posameznika temelji na podlagi verjetnosti pre- ºivetja za trenutno starost osebe in njeno starost £ez 10 let:

S10(starost) = S(starost+ 10) S(starost) .

Desetletno tveganje za smrt posameznika zaradi bolezni srca in oºilja je enako tveganje= 1−S10(starost).

(20)

8. Rezultati in ugotovitve

Opazovanih je bilo 5049 oseb. Od tega je bilo 2279 mo²kih in 2770 ºensk. 559 mo²kih in 387 ºensk je v £asu ²tudije umrlo zaradi bolezni srca in oºilja.

8.1. Kajenje in deleº umrlih

Od vseh sodelujo£ih je bilo 1140 kadilk, kar predstavlja 41,2% deleº vseh sodelu- jo£ih ºensk in 1473 kadilcev, kar predstavlja 64,6% deleº vseh sodelujo£ih mo²kih.

Takih ºensk, ki so kadile ter umrle v £asu ²tudije, je bilo 140, mo²kih pa 364.

Primerjava za ºenske:

Kajenje Vse take Umrle Deleº umrlih Kadilke 1140 140 12,28 % Nekadilke 1630 247 15,15%

Tabela 1. Deleº umrlih ºensk zaradi sr£noºilnih bolezni glede na ka- jenje. Izra£unani deleºi umrlih so glede na vse ºenske znotraj skupine z enakimi lastnostmi.

Primerjava za mo²ke:

Kajenje Vsi taki Umrli Deleº umrlih Kadilci 1473 362 24,71 % Nekadilci 806 195 24,19 %

Tabela 2. Deleº umrlih mo²kih zaradi sr£noºilnih bolezni glede na kajenje. Izra£unani deleºi umrlih so glede na vse mo²ke znotraj sku- pine z enakimi lastnostmi.

Ker vemo, da se tveganje za ºenske pove£a ²ele po 55. letu, se sedaj omejimo le na ºenske, starej²e od 55 let in 60 let.

Kajenje šenske nad 55 let šenske nad 60 let

Kadilke 42,19 % 75,00 %

Nekadilke 35,04 % 31,09 %

Tabela 3. Deleº umrlih ºensk zaradi sr£noºilnih bolezni glede na starost in kajenje. Izra£unani deleºi umrlih so glede na vse ºenske znotraj skupine z enakimi lastnostmi.

Pri mo²kih smo se omejili ºe na 50. leta, saj se njihovo tveganje povi²a prej.

Kajenje Mo²ki nad 50 let Mo²ki nad 55 let

Kadilci 42,58 % 42,66 %

Nekadilci 41,61 % 16,87 %

Tabela 4. Deleº umrlih mo²kih zaradi sr£noºilnih bolezni glede na starost in kajenje. Izra£unani deleºi umrlih so glede na vse mo²ke znotraj skupine z enakimi lastnostmi.

(21)

To nakazuje na to, da kajenje vpliva na deleº umrlih zaradi bolezni srca in oºilja, vendar le pri starej²ih posameznikih. Sklepamo lahko, da so posledice kajenja vidne

²ele kasneje ali pa, da kajenje samo po sebi ne pove£uje deleºa umrlih. Skupaj z drugimi dejavniki, kot je na primer starost, se deleº umrlih pove£a. Tveganje za sr£noºilne bolezni pri starostih med 40 in 55 let se pri ºenskah bistveno ne spreminja med kadilkami in nekadilkami. Pri mo²kih so spremembe med kadilci in nekadilci opazne ºe po 50. letu.

8.2. Holesterol in deleº umrlih Primerjava za mo²ke:

Holesterol (v mmol/L) Vsi taki Umrli Deleº umrlih

Nad 8 53 20 37,74 %

Med 7 in 8 231 77 33,33 %

Med 5 in 7 1517 381 25,12 %

Pod 5 478 81 16,95 %

Tabela 5. Deleº umrlih mo²kih zaradi sr£noºilnih bolezni glede na holesterol. Izra£unani deleºi umrlih so glede na vse posameznike zno- traj skupine z enakimi lastnostmi.

Primerjava za ºenske:

Holesterol (v mmol/L) Vsi taki Umrli Deleº umrlih

Nad 8 132 39 29,56 %

Med 7 in 8 335 86 25,67 %

Med 5 in 7 1630 218 13,37 %

Pod 5 673 44 6,54 %

Tabela 6. Deleº umrlih ºensk zaradi sr£noºilnih bolezni glede na ho- lesterol. Izra£unani deleºi umrlih so glede na vse posameznike znotraj skupine z enakimi lastnostmi.

Za povi²an skupni holesterol ²tejemo stanja, kjer je le ta vi²ji od 5 mmol/L. Deleº umrlih s povi²anim holesterolom je ve£ji kot pri populaciji z normalnim holesterolom.

Spet se izpostavljenost pove£a pri mo²kih.

8.3. Sistoli£ni krvni tlak (SBP) in deleº umrlih Primerjava za mo²ke:

SBP (v mmHg) Vsi taki Umrli Deleº umrlih

Nad 160 235 136 57,87 %

Med 140 in 160 674 195 28,93 %

Pod 140 1370 228 16,64 %

Tabela 7. Deleº umrlih mo²kih zaradi sr£noºilnih bolezni glede na SBP. Izra£unani deleºi umrlih so glede na vse posameznike znotraj skupine z enakimi lastnostmi.

(22)

Primerjava za ºenske:

SBP (v mmHg) Vsi taki Umrli Deleº umrlih

Nad 160 391 136 34,78 %

Med 140 in 670 674 127 18,96 %

Pod 140 1709 124 7,26 %

Tabela 8. Deleº umrlih ºensk zaradi sr£noºilnih bolezni glede na SBP. Izra£unani deleºi umrlih so glede na vse posameznike znotraj skupine z enakimi lastnostmi.

Povi²an sistoli£ni krvni tlak (to je ve£ od 140 mmHg) ob£utno povi²a deleº umrlih,

²e posebej pri mo²ki populaciji. Poleg tega povi²ani krvni tlak veliko bolj vpliva na tveganje za smrt zaradi bolezni srca in oºilja kot povi²an holesterol. To si bomo pogledali v nadaljevanju.

8.4. Desetletno tveganje in kajenje

Tveganje opazujemo po starostnih skupinah. Primerjamo, kako se tveganje spre- meni glede na skupine nekadilcev in kadilcev pri enakem holesterolu in sistoli£nem krvnem tlaku.

Primerjava za ºenske:

Starostna skupina Povi²anje tveganja pri kadilkah v primerjavi z nekadilkami

65 let 2-7 %

60 let 1-4 %

55 let 1-2 %

50 let 0 -1 %

40 let ni sprememb

Tabela 9. Razlika v desetletnem tveganju glede na kajenje pri ºenskah.

Primerjava za mo²ke:

Starostna skupina Povi²anje tveganja pri kadilcih v primerjavi z nekadilci

65 let 3 - 13 %

60 let 2 - 10 %

55 let 1- 6 %

50 let 1-4 %

40 let 0 -1 %

Tabela 10. Razlika v desetletnem tveganju glede na kajenje pri mo²kih.

Opazimo, da kajenje zagotovo zvi²a tveganje za smrt zaradi sr£noºilnih bolezni.

Razlika je bolj ob£utna pri mo²kih in se s starostjo ve£a.

(23)

8.5. Desetletno tveganje in holesterol

Najprej si oglejmo, za koliko si povi²ajo desetletno tveganje za smrt sr£noºilnih bolezni posamezniki z visokimi vrednostmi holesterola v primerjavi s posamezniki z nizkimi vrednostmi. Sistoli£nega krvnega tlaka sedaj ne opazujemo.

Starostna skupina Nekadilke Kadilke Nekadilci Kadilci

65 let 2-4 % 3 - 7 % 6 - 13 % 9 - 21 %

60 let 1-3 % 2 - 4 % 4- 12 % 5 - 16 %

55 let 1-2 % 1-2 % 3 - 8 % 4 - 10 %

50 let 0 -1 % 0 - 1 % 1-4 % 2 - 6 %

40 let ni sprememb ni sprememb 0 -1 % 0 - 2 % Tabela 11. Razlika v desetletnem tveganju med posamezniki z nor- malnim in povi²anim holesterolom, glede na starost, spol in kajenje.

Ogledali si bomo ²e, kako razlika v holesterolu med 4 in 8 mmol/L vpliva na desetletno tveganje za smrt. Razdelimo po spolu, kajenju in sistoli£nem krvnem tlaku, tokrat ne upo²tevamo starosti. Pridobljeni podatki prikazujejo, za koliko se posamezniku z 8 mmol/L holesterola pove£a desetletno tveganje za smrt zaradi bolezni srca in oºilja v primerjavi s posameznikom s 4 mmol/L holesterola.

SBP v mmHg Nekadilke Kadilke Nekadilci Kadilci

120 1 % 1,2 % 3 % 4,2 %

140 0,8 % 2 % 4,2 % 6 %

160 1,4 % 2,4 % 6 % 8,4 %

180 2 % 2,8 % 8,4 % 11 %

Tabela 12. Pove£anje desetletnega tveganja posameznikov s 8 mmo- l/L holesterola v primerjavi s posamezniki s 4 mmol/L holesterola, glede na SBP, spol in kajenje.

ƒe primerjamo le glede na sistoli£ni krvni tlak dobimo:

SBP v mmHg Pove£anje

120 2,35 %

140 3,25 %

160 4,55 %

180 6,05 %

Tabela 13. Pove£anje desetletnega tveganja posameznikov s 8 mmo- l/L holesterola v primerjavi s posamezniki s 4 mmol/L holesterola, glede na SBP.

Iz tega lahko zaklju£imo, da povi²anje holesterola iz 4 na 8 mmol/L v povpre-

£ju zvi²a desetletno tveganje za smrt zaradi sr£noºilnih bolezni za 4,05 %. Povi²an holesterol v mlaj²ih letih ²e nima ob£utnega vpliva na pove£anje tveganja za smrt zaradi bolezni srca in oºilja. Razlika postane ve£ja z vi²jo starostjo in kajenjem. ƒe primerjamo spole, vidimo, da so ºenske manj podvrºene vplivom povi²anega hole- sterola kot mo²ki.

(24)

8.6. Desetletno tveganje ob spremembi SBP

Zanimalo nas je ²e, kako razlika v sistoli£nem krvnem tlaku med 120 in 180 mmHg vpliva na tveganje. Razdelimo po spolu, kajenju in holesterolu, tokrat ne upo²te- vamo starosti. Pridobljeni podatki prikazujejo, za koliko se posameznikom s 180 mmHg sistoli£nega krvnega tlaka pove£a desetletno tveganje za smrt zaradi sr£no- ºilnih bolezni v primerjavi s posamezniki s 120 mmHg sistoli£nega krvnega tlaka.

Holesterol v mmol/L Nekadilke Kadilke Nekadilci Kadilci

4 1,6 % 2,6 % 6 % 8,8 %

5 2 % 3 % 7,4 % 10,2 %

6 2,2 % 3,4 % 8,4 % 11,6 %

7 2,4 % 4 % 10 % 13,4 %

8 2,6 % 4,2 % 11,4 % 15,6 %

Tabela 14. Pove£anje desetletnega tveganja posameznikov s 180 mmHg SBP v primerjavi s posamezniki s 120 mmHg SBP, glede na holesterol, spol in kajenje.

ƒe primerjamo le glede na holesterol, dobimo naslednje:

Holesterol v mmol/L Pove£anje

4 4,75 %

5 5,65 %

6 6,4 %

7 7,45 %

8 8,45 %

Tabela 15. Pove£anje desetletnega tveganja posameznikov s 180 mmHg SBP v primerjavi s posamezniki s 120 mmHg SBP, glede na holesterol.

Zaklju£imo lahko, da povi²anje sistoli£nega krvnega tlaka iz 120 na 180 mmHg v povpre£ju zvi²a desetletno tveganje za smrt zaradi sr£noºilnih bolezni za 6,54 %.

Zelo nazorno se iz prej²njih dveh razpredelnic vidi, da povi²ane vrednosti SBP v kombinaciji s povi²anim holesterolom in kajenjem situacijo poslab²a. Poleg tega lahko potrdimo opazko, da povi²an krvni tlak bolj vpliva na tveganje za smrt zaradi bolezni srca in oºilja kot povi²an holesterol.

V spodnji razpredelnici so zdruºne vse ugotovitve glede na vse spremenljivke tveganja.

(25)

180 8 9 10 11 12 12 14 15 17 19 19 23 27 31 36 28 32 37 43 49 160 6 7 8 9 10 10 11 12 13 15 13 16 19 22 26 19 23 27 31 36 140 5 5 6 7 7 7 8 9 10 12 9 11 13 15 18 13 16 19 22 26 120 4 4 4 5 6 6 6 7 8 9 6 7 9 10 12 9 11 13 15 18 180 4 5 6 6 7 7 8 9 10 11 12 15 17 20 24 18 21 25 29 34 160 3 4 4 5 5 5 6 7 8 9 8 10 12 14 17 12 15 17 20 24 140 3 3 3 4 4 4 5 5 6 7 6 7 8 10 11 8 10 12 14 17 120 2 2 3 3 3 3 4 4 4 5 4 5 5 6 8 6 7 8 10 11 180 2 3 3 3 4 4 4 5 5 6 7 9 10 12 15 11 13 15 18 21 160 2 2 2 3 3 3 3 4 4 5 5 6 7 8 10 7 9 10 12 15 140 1 2 2 2 2 2 2 3 3 3 3 4 5 6 7 5 6 7 8 10 120 1 1 1 1 2 2 2 2 2 3 2 3 3 4 5 3 4 5 6 7 180 1 1 1 2 2 2 2 2 3 3 4 5 6 7 8 6 7 9 10 12 160 1 1 1 1 1 1 2 2 2 2 3 3 4 5 6 4 5 6 7 8 140 1 1 1 1 1 1 1 1 1 2 2 2 3 3 4 3 3 4 5 6 120 0 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 4 180 0 0 0 0 0 0 0 0 0 0 1 1 1 2 2 1 2 2 2 3 160 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 140 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 120 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 4 5 6 7 8 4 5 6 7 8 4 5 6 7 8 4 5 6 7 8

*Vse vrednosti so v odstotkih.

ŽENSKE Nekadilke

Holesterol (v mmol/L) Starost

Desetletno tveganje za srčno žilne bolezni s smrtnim izidom MOŠKI

Nekadilci Kadilci

Sistolični krvni tlak (v mmHg)

Kadilke

40 65

60

55

50

Slika 3. Desetletno tveganje za sr£noºilne bolezni s smrtnim izidom, izra£unano s pomo£jo Weibullovega regresijskega modela.

(26)

9. Primerjava z razpredelnicami tveganj score

Na²e ugotovitve lahko primerjamo z aktualnimi razpredelnicami tveganj, ki se trenutno uporabljajo v medicini za ocenjevanje tveganja bolezni srca in oºilja. Gre za evropski model, ki ga je razvilo Evropsko kardiolo²ko dru²tvo. Kratica SCORE izhaja iz sistemati£nega vrednotenja koronarnega tveganja (Systematic COronary Risk Evaluation). Podatki so razdeljeni v dve tabeli - visoko in nizko sr£noºilno tve- ganje, ki je izra£unano na podlagi spola, starosti, skupnega holesterola, sistoli£nega krvnega tlaka in statusa kajenja.

Evropske drºave so razdeljene na drºave, v katerih uporabljajo tabelo nizkega tveganja, med katerimi je tudi Slovenija, in na drºave v katerih uporabljajo tabelo visokega tveganja.

Slika 4. Desetletno tveganje za sr£noºilne bolezni s smrtnim izidom v regijah z visokim tveganjem v Evropi SCORE. (R.M. Conroy, 2003)

(27)

Slika 5. Desetletno tveganje za sr£noºilne bolezni s smrtnim izidom v regijah z nizkim tveganjem v Evropi SCORE. (R.M. Conroy, 2003)

Razpredelnica, katero smo izra£unali z Weibullovim regresijskim modelom, se do- kaj ujema z razpredelnico visokega tveganja. To£nost ocene tveganj v SCORE za- gotavlja velik nabor podatkov, ki temelji na 12-ih evropskih kohortnih ²tudijah in 250 000 pacientih.

(28)

10. Priloge

Koda v programu R; analiza desetletnega tveganja za smrt zaradi sr£noºilnih bolezni za mo²ke. Analogna koda za ºensko populacijo.

#UVOZ POTREBNIH KNJIZNIC l i b r a r y( dplyr )

l i b r a r y( ggplot2 )

l i b r a r y( SurvRegCensCov ) l i b r a r y( s u r v i v a l )

l i b r a r y( gridExtra ) l i b r a r y(g r i d) l i b r a r y( x l s x ) l i b r a r y( p l o t r i x )

#UREJANJE PODATKOV

#Prebere t a b e l o

podatki <= read.csv(' fram_r . csv ')

#Sprememba enot h o l e s t e r o l a , oba h o l e s t e r o l a zdruzimo

#( ce j e en NA uporabimo drugega , v primeru ko s ta NA oba v r s t i c o ostranimo , ce imamo obe v r e d n o s t i izracunamo njuno povprecje ) podatki$hol_mmol1 <= podatki$sc1 * 0.02586

podatki$hol_mmol2 <= podatki$sc2 * 0.02586

podatki$hol_mmol1 <= i f e l s e(i s.na( podatki$hol_mmol1) , podatki$hol_mmol2 , podatki$hol_mmol1)

podatki$hol_mmol2 <= i f e l s e(i s.na( podatki$hol_mmol2) , podatki$hol_mmol1 , podatki$hol_mmol2)

podatki$hol_mmol1 [i s.na( podatki$hol_mmol1) ] <=0 podatki$hol_mmol2 [i s.na( podatki$hol_mmol2) ] <=0

podatki$hol <= ( podatki$hol_mmol1 + podatki$hol_mmol2)/2 podatki$hol [ podatki$hol == 0 ] <= NA

podatki <= podatki [! i s.na( podatki$hol ) , ] podatki$hol_mmol1 <= NULL

podatki$hol_mmol2 <= NULL podatki$sc1 <= NULL

podatki$sc2 <= NULL

#Spol ( zenska = 0 , moski = 1)

podatki$sex <= as.numeric( podatki$sex )

podatki$sex <= i f e l s e( podatki$sex == 2 , 0 , 1)

#Kajenje . 0 ce v dnevu ne skadi nobene c i g a r e t e in 1 ce skadi 1 a l i vec c i g a r e t na dan .

#Odstranitev NA v r s t i c v s t o l p c u smoke

podatki$smoke <= i f e l s e( podatki$smoke != 0 , 1 , podatki$smoke ) podatki <= podatki [! i s.na( podatki$smoke ) , ]

(29)

#Zdruzi vse srcno z i l n e b o l e z n i (med njimi ne bomo r a z l i k o v a l i ) podatki$death_cardiov <= podatki$chd + podatki$cva

podatki$chd <= NULL podatki$cva <= NULL

#Indeks t e l e s n e t e z e

#ITM = t e l e s n a teza ( kg ) / ( v i s i n a (m) ) 2

podatki$ITM <= podatki$ht / ( podatki$wt/100) ^2 podatki$ht <= NULL

podatki$wt <= NULL podatki$mrw <= NULL

#ce j e drugi vzrok smrti , kot s r c n o z i l n e b o l e z n i

#( t o r e j p r i s p r e m e l j i v k i cause vzamemo t i s t e k i so enake 5 , 6 , 9)

podatki$death_other <= i f e l s e( podatki$cause == 5 | podatki$cause == 6 | podatki$cause == 9 , 1 , 0)

#odstanim cause , ca , oth podatki$cause <= NULL podatki$ca <= NULL podatki$oth <= NULL

#Krnjeni podatki ( 1 ) a l i ne k r n j e n i ( 0 )

podatki$cens <= i f e l s e( podatki$surv == 1 , 0 , 1)

#PODATKI ZA MOSKO POPULACIJO

#Locimo moske

moski <= subset( podatki , sex >= 1) moski$ID <= seq. i n t (nrow( moski ) ) var2m <= moski$age = 20

var3m <= moski$sbp = 120 var4m <= moski$hol = 6 var5m <= moski$smoke nm <= length( moski$X)

smrt_a l i_konec <= matrix( moski$age =20 + ( moski$lexam * 2) , nrow = nm, ncol = 1)

#Krnjeni podatki : P r e z i v e l i + umrli za drugimi boleznimi v casu s t u d i j e f o r ( i in 1 :nm) {

i f ( moski$surv [ i ] == 0 | ( moski$surv [ i ] == 1 & moski$death_other [ i ]

== 1) ) {

moski$cenzura [ i ] <= 0 }

e l s e{

moski$cenzura [ i ] <= 1 }

}

(30)

#Dodamo v t a b e l o moski var3m , var4m , var5m moski$var3m <= var3m

moski$var4m <= var4m moski$var5m <= var5m

#Pridobitev parametrov za Weibullovo p o r a z d e l i t e v

probam <= survreg ( Surv ( smrt_a l i_konec , moski$cenzura , type = ' r i g h t ') ~ var3m + var4m + var5m , data = moski , d i s t = " w e i b u l l ")

convertm <= ConvertWeibull ( probam , conf . l e v e l = 0 . 9 5 ) vars_convertm <= data.frame( convertm$vars )

beta_moski <= c( vars_convertm [ 3 , 1 ] , vars_convertm [ 4 , 1 ] , vars_convertm [ 5 , 1 ] )

beta_sbp_moski <= vars_convertm [ 3 , 1 ] beta_hol_moski <= vars_convertm [ 4 , 1 ] beta_smoke_moski <= vars_convertm [ 5 , 1 ] lambda_moski <= vars_convertm [ 1 , 1 ] gamma_moski <= vars_convertm [ 2 , 1 ]

#Koliko moskih j e umrlo z a r a d i s r c n o z i l n i h b o l e z n i a <= t a b l e( moski$death_cardiov )

#___________________________________________________________________

#KAJENJE

b <= t a b l e( moski$smoke ) k a d i l c i <= b [ 2 ]

n e k a d i l c i <= b [ 1 ]

d e l e z <= ( k a d i l c i )/( n e k a d i l c i + k a d i l c i )

#Smrt k a d i l c e v

c <= t a b l e( ( moski$death_cardiov==1) & ( moski$smoke == 1) )

#Smrt n e k a d i l c e v

s_nesmok <= t a b l e( ( moski$death_cardiov == 1) & ( moski$smoke == 0) )

#Smrt nad 50 l e t

moski_k a d i l c i <= subset( moski , smoke > 0)

moski_k a d i l c i_50 <= subset( moski_k a d i l c i , age > 50)

moski_k a d i l c i_50_umrli <= subset( moski_k a d i l c i_50 , moski_k a d i l c i_50$ death_cardiov == 1)

moski_n e k a d i l c i <= subset( moski , smoke <= 0)

moski_n e k a d i l c i_50 <= subset( moski_n e k a d i l c i , age > 50)

moski_n e k a d i l c i_50_umrli <= subset( moski_n e k a d i l c i_50 , moski_n e k a d i l c i_

50$death_cardiov == 1)

#Smrt nad 55 l e t

moski_k a d i l c i <= subset( moski , smoke > 0)

moski_k a d i l c i_55 <= subset( moski_k a d i l c i , age > 55)

moski_k a d i l c i_55_umrli <= subset( moski_k a d i l c i_55 , moski_k a d i l c i_55$ death_cardiov == 1)

(31)

moski_n e k a d i l c i <= subset( moski , smoke <= 0)

moski_n e k a d i l c i_55 <= subset( moski_n e k a d i l c i , age > 55)

moski_n e k a d i l c i_55_umrli <= subset( moski_n e k a d i l c i_55 , moski_n e k a d i l c i_

55$death_cardiov == 1)

#___________________________________________________________________

#Tveganje in SBP

moski_SBP <= subset( moski , moski$sbp >= 140)

moski_SBP_1 <= subset( moski_SBP, moski_SBP$sbp <= 160)

m_smrt_SBP_140_160 <= t a b l e( ( moski_SBP_1$death_cardiov == 1) ) moski_SBP_140 <= subset( moski , moski$sbp < 140)

m_smrt_SBP_140 <= t a b l e( ( moski_SBP_140$death_cardiov == 1) ) moski_SBP_160 <= subset( moski , moski$sbp > 160)

m_smrt_SBP_160 <= t a b l e( ( moski_SBP_160$death_cardiov == 1) )

#___________________________________________________________________

#Tveganje in hol

moski_hol_5 <= subset( moski , moski$hol < 5)

m_smrt_hol_5 <= t a b l e( ( moski_hol_5$death_cardiov == 1) ) moski_hol_5_7 <= subset( moski , moski$hol > 5)

moski_hol_57_1 <= subset( moski_hol_5_7 , moski_hol_5_7$hol < 7) m_smrt_hol_57 <= t a b l e( ( moski_hol_57_1$death_cardiov == 1) )

moski_hol_7_8 <= subset( moski , moski$hol > 7)

moski_hol_78_1 <= subset( moski_hol_7_8 , moski_hol_7_8$hol < 8) m_smrt_hol_78 <= t a b l e( ( moski_hol_78_1$death_cardiov == 1) )

moski_hol_7 <= subset( moski , moski$hol > 8)

m_smrt_hol_7 <= t a b l e( ( moski_hol_7$death_cardiov == 1) )

#REZULTATI ZA MOSKE

#Funkcija , k i izracuna tveganja g le de na l a s t n o s t i posameznika in r e z u l t a t e i z p i s e v Excel

s t a r o s t 1 <= c(65 , 60 , 55 , 50 , 40) sbp <= c(180 , 160 , 140 , 120) hol <= c( 4 , 5 , 6 , 7 , 8 )

d <= 0

k a j e n j e <= c( 0 , 1 ) f o r ( k in k a j e n j e ) {

f o r ( s t a r o s t in s t a r o s t 1 ) { vektor <= vector( )

f o r ( i in hol ) { f o r( j in sbp ) {

vektor_pomozni <= vector( ) Z <= c( j , i , k )

w <= beta_sbp_moski * (Z [ 1 ] = 120) + beta_hol_moski * (Z [ 2 ] = 6) + beta_smoke_moski*Z [ 3 ]

(32)

S_agem <= f u n c t i o n( x ) {( exp(=lambda_moski * ( x = 20) ^ gamma_

moski ) ) ^exp(w) }

v e r j e t n o s t_p r e z i v e t j a 2 <= S_agem ( s t a r o s t + 10)/S_agem ( s t a r o s t ) r i s k 2 <= (round(1 = v e r j e t n o s t_p r e z i v e t j a 2 , 2 ) )*100

vektor_pomozni <= append( vektor_pomozni , r i s k 2 ) vektor <= append( vektor , vektor_pomozni )

} }

matrika_vektor <= matrix(data = vektor , nrow = 4 , ncol = 5) colnames( matrika_vektor ) <= c( hol )

rownames( matrika_vektor ) <= c( sbp ) d <= d + 1

i f (d == 1) {

Tabela1 = as.data.frame( matrika_vektor )

writ e. x l s x ( Tabela1 , "C: \ \ Users \\ Sabrina Calcina \\Documents\\

GitHub\\ Diplomska=naloga \\ ugotovitve \\ tabela1 . x l s x ", sheetName = "m_nons_65", append=FALSE)

}

i f (d == 2) {

Tabela2 = as.data.frame( matrika_vektor )

writ e. x l s x ( Tabela2 , f i l e = "C: \\ Users \\ Sabrina Calcina \\Documents

\\GitHub\\ Diplomska=naloga \\ ugotovitve \\ t abela1 . x l s x ", sheetName = "m_nons_60", append=TRUE)

}

i f (d == 3) {

Tabela3 = as.data.frame( matrika_vektor )

writ e. x l s x ( Tabela3 , f i l e = "C: \\ Users \\ Sabrina Calcina \\Documents

\\GitHub\\ Diplomska=naloga \\ ugotovitve \\ t abela1 . x l s x ", sheetName = "m_nons_55", append=TRUE)

}

i f (d == 4) {

Tabela4 = as.data.frame( matrika_vektor )

writ e. x l s x ( Tabela4 , f i l e = "C: \\ Users \\ Sabrina Calcina \\Documents

\\GitHub\\ Diplomska=naloga \\ ugotovitve \\ t abela1 . x l s x ", sheetName = "m_nons_50", append=TRUE)

}

i f (d == 5) {

Tabela5 = as.data.frame( matrika_vektor )

writ e. x l s x ( Tabela5 , f i l e = "C: \\ Users \\ Sabrina Calcina \\Documents

\\GitHub\\ Diplomska=naloga \\ ugotovitve \\ t abela1 . x l s x ", sheetName = "m_nons_40", append=TRUE)

}

i f (d == 6) {

Tabela6 = as.data.frame( matrika_vektor )

writ e. x l s x ( Tabela6 , f i l e = "C: \\ Users \\ Sabrina Calcina \\Documents

\\GitHub\\ Diplomska=naloga \\ ugotovitve \\ t abela1 . x l s x ", sheetName = "m_smok_65", append=TRUE)

}

i f (d == 7) {

Tabela7 = as.data.frame( matrika_vektor )

Reference

POVEZANI DOKUMENTI

1 Univerza v Ljubljani, Fakulteta za Elektrotehniko 1000 Ljubljana, Trˇzaˇska 25, Slovenija. Matematika FE, Ljubljana,

Marjan Jerman, Univerza v Ljubljani, Fakulteta za matematiko in fiziko, član Silva Kmetič, Zavod RS za šolstvo, članica7. Samo Repolusk, Univerza v Mariboru, Fakulteta za

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in raˇ cunalniˇstvo Matematika

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in raˇ cunalniˇstvo Matematika

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in raˇ cunalniˇstvo Matematika

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in raˇ cunalniˇstvo Matematika

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in raˇ cunalniˇstvo Matematika

Metode podatkovne analitike pri nadzoru kakovosti ˇstudija si lahko pogledamo skozi analize ocen (po predmetih, po ˇ casu), analize pretoˇ cnosti (skozi predmete ter skozi letnike)