• Rezultati Niso Bili Najdeni

Pregled in uporaba raˇcunskih metod za analizo ritmiˇcne pojavnosti dogodkov

N/A
N/A
Protected

Academic year: 2022

Share "Pregled in uporaba raˇcunskih metod za analizo ritmiˇcne pojavnosti dogodkov"

Copied!
59
0
0

Celotno besedilo

(1)

Univerza v Ljubljani

Fakulteta za raˇ cunalniˇ stvo in informatiko

Nina Velikajne

Pregled in uporaba raˇ cunskih metod za analizo ritmiˇ cne pojavnosti

dogodkov

DIPLOMSKO DELO

UNIVERZITETNI ˇSTUDIJSKI PROGRAM PRVE STOPNJE

RA ˇCUNALNIˇSTVO IN INFORMATIKA

Mentor : izr. prof. dr. Miha Moˇskon

Ljubljana, 2021

(2)

Copyright. Rezultati diplomske naloge so intelektualna lastnina avtorja in matiˇcne fakultete Univerze v Ljubljani. Za objavo in koriˇsˇcenje rezul- tatov diplomske naloge je potrebno pisno privoljenje avtorja, fakultete ter mentorja.

Besedilo je oblikovano z urejevalnikom besedil LATEX.

(3)

Fakulteta za raˇcunalniˇstvo in informatiko izdaja naslednjo nalogo:

Tematika naloge: Pregled in uporaba raˇcunskih metod za analizo ritmiˇcne pojavnosti dogodkov

Kandidatka naj v svoji nalogi pregleda moˇznosti uporabe modela cosinor pri analizi dogodkov z ritmiˇcno pojavnostjo. Preuˇci naj razliˇcne verjetnostne po- razdelitve, ki jih lahko uporabimo v kombinaciji z modelom cosinor. Izbere naj merila, ki nas lahko pri danih podatkih vodijo pri izbiri najustreznejˇsega modela za analizo ritmiˇcne pojavnosti dogodkov. Celoten pristop naj im- plementira v izbranem programskem jeziku in uporabi pri analizi dostopnih podatkov o ˇstevilu vozil ob posamezni uri dneva.

(4)
(5)

Zahvaljujem se mentorju izr. prof. dr. Mihi Moˇskon za vodenje in usmer- janje. Zahvaljujem se tudi Druˇzbi za avtoceste v Republiki Sloveniji in Mi- nistrstvu za infrastrukturo za posredovanje podatkov o prometu. Hvala tudi bliˇznjim za vzpodbudo in podporo.

(6)
(7)

Kazalo

Povzetek Abstract

1 Uvod 1

2 Metode 5

2.1 Analiza cirkadianih podatkov . . . 5

2.1.1 Metoda cosinor . . . 7

2.2 Analiza ˇstevnih cirkadianih podatkov . . . 7

2.3 Analiza raˇcunskih modelov za ˇstevne podatke . . . 8

2.3.1 Poissonov model . . . 9

2.3.2 Generaliziran Poissonov model . . . 10

2.3.3 Poissonov model z inflacijo niˇcel . . . 10

2.3.4 Negativen binomski model . . . 11

2.3.5 Negativen binomski model z inflacijo niˇcel . . . 12

2.4 Analiza metod za vrednotenje modelov . . . 12

2.4.1 Metode za vrednotenje gnezdenih modelov . . . 13

2.4.2 Metode za vrednotenje negnezdenih modelov . . . 13

2.5 Pridobitev in pregled testnih podatkov . . . 14

2.6 Postopek celotne raˇcunske metode . . . 17

3 Opis analize 19 3.1 Rezultati raˇcunskih modelov . . . 19

(8)

3.2 Ovrednotenje raˇcunskih modelov . . . 23

3.3 Analiza trenda prometnih podatkov . . . 25

3.3.1 Analiza vpliva dneva v tednu . . . 25

3.3.2 Analiza vpliva vremena . . . 29

3.3.3 Analiza glede na kategorijo vozila . . . 30

3.3.4 Analiza vpliva epidemije COVID-19 . . . 33

4 Diskusija 39

5 Zakljuˇcek 41

Literatura 43

(9)

Seznam uporabljenih kratic

kratica angleˇsko slovensko API application programming in-

terface

aplikacijski programski vme- snik

MESOR midline estimating statistic of rhythm

srednja vrednost ritma GP generalized Poisson generaliziran Poisson NB negative binomial negativen binomski

OLS ordinary least squares metoda najmanjˇsih kvadratov GLM generalized linear model generaliziran linearni model

(10)
(11)

Povzetek

Naslov: Pregled in uporaba raˇcunskih metod za analizo ritmiˇcne pojavnosti dogodkov

Avtor: Nina Velikajne

V okviru diplomskega dela smo vzpostavili metodologijo za analizo ritmiˇcne pojavnosti dogodkov. Implementirali smo zbirko funkcij, ki jih lahko ne- posredno uporabimo pri analizi cirkadianih ˇstevnih podatkov. Za analizo tovrstnih podatkov moramo zdruˇziti metode za detekcijo ritma z metodami za ˇstevne podatke. Za detekcijo ritma in transformacijo vhodnih podatkov smo uporabili metodo cosinor. Implementirana raˇcunska metoda dovoljuje tudi poljubno nastavljanje ˇstevila komponent. Za analizo ˇstevnih podatkov in reˇsevanje regresijskega problema smo uporabili pet raˇcunskih modelov, in sicer Poissonov model, generaliziran Poissonov model, Poissonov model z inflacijo niˇcel, negativen binomski model in negativen binomski model z inflacijo niˇcel. Vzpostavljena metoda omogoˇca primerjavo in iskanje najbolj ustreznega raˇcunskega modela z optimalnim ˇstevilom komponent. Vsebuje tudi funkcije, ki omogoˇcajo primerjavo ritma v odvisnosti od razliˇcnih fak- torjev. Celotna raˇcunska metoda je bila testirana na dveh prometnih po- datkovnih zbirkah, ki so nam jih posredovali z Ministrstva za infrastrukturo.

Kljuˇcne besede: ˇstevni podatki, ritmiˇcni podatki, cirkadiani ritem, cosinor, pojavnost dogodkov, regresija, promet.

(12)
(13)

Abstract

Title: Overview and application of computational approaches for the anal- ysis of rhythmicity in count data

Author: Nina Velikajne

In the thesis we have established a methodology for the analysis of rhyth- micity in count data. We have implemented a set of functions, that we can use directly for the analysis of circadian count data. To analyse this type of data, we need to combine methods for rhythmicity detection with methods for analysing count data. For the purpose of rhythmicity detection and trans- formation of input data, we have used the cosinor method. The implemented computational method allows to identify the number of components automat- ically. For the analysis of the count data and the solution of the regression problem we have used five computational models – Poisson model, general- ized Poisson model, zero-inflated Poisson model, negative binomial model, and zero-inflated negative binomial model. The established method allows us to compare and find the most suitable model with the optimal number of components. The method also includes functions to compare the rhythm in dependence of different factors. The complete method was tested on two traffic datasets obtained from the Ministry of Infrastructure of Republic of Slovenia.

Keywords: count data, rhythmic data, circadian rhythm, cosinor, event occurrence, regression, traffic.

(14)
(15)

Poglavje 1 Uvod

Dandanes so podatki eden izmed glavnih produktov ˇstevilnih raziskav. Po- datke obiˇcajno beleˇzimo tudi tekom izvajanja aplikacij, saj ti sluˇzijo za ka- snejˇse analize razliˇcnih dogodkov. Zbiranje podatkov je torej postalo vsepri- sotno, vsled temu pa so postale vedno bolj pomembne tudi metode za njihovo hitro in uˇcinkovito analizo. Z analizo podatkov lahko laˇzje razumemo in po- jasnimo dogajanje v izbranem kontekstu. Napredek metod za zbiranje in analizo podatkov je spodbudil razvoj nove veje raˇcunalniˇstva tj. znanosti o podatkih.

Pri delu s podatki se moramo zavedati, da niso vsi podatki enaki. Lahko imajo ciljno spremenljivko, lahko ne, nekateri so diskretni, nekateri zvezni.

Ce ˇˇ zelimo izluˇsˇciti kaj koristnega in relevantnega moramo najprej pravilno prepoznati tip naˇsih podatkov in ˇsele nato izbrati ustrezne raˇcunske metode za njihovo analizo. V tem delu se bomo osredotoˇcili na analizo ˇstevnih cir- kadianih podatkov.

Cirkadiani podatki so podatki s cirkadianim ritmom. Gre za naraven, notranji ritem, ki ga regulira in sinhronizira Zemljina rotacija vsakih 24 ur [18]. Dnevni ritem s periodo 24 ur vpliva na naˇse delovanje bolj kot si to lahko predstavljamo. Na primer, delovanje ˇceˇsarike ali epifize je vezano na 24-urni cikel in dnevno svetlobo. Hormon melatonin se sproˇsˇca le zveˇcer in tako uravnava naˇs notranji ritem [20]. Cirkadiani ritem je torej povezan z

1

(16)

2 Nina Velikajne vsem, od sproˇsˇcanja hormonov v naˇsem telesu do ritma naˇsega ˇzivljenja.

Poseben tip podatkov predstavljajo ˇstevni podatki, ki opisujejo pojav- nost izbranih dogodkov. V statistiki so to podatki, katerih vrednosti lahko zavzamejo le nenegativna cela ˇstevila. Te vrednosti so pridobljene na podlagi ˇstetja dogodkov [19].

Stevni podatki in cirkadiani podatki se velikokrat pojavijo skupaj. Toˇ pomeni, da imajo podatki periodo 24 ur in so ˇstevnega tipa. V naravi in naˇsi okolici so taki podatki vseprisotni. Z njihovo analizo lahko pripomoremo k razumevanju razliˇcnih dogodkov in posredno k razumevanju delovanja orga- nizmov, druˇzbenih sistemov. Na primer, analiza ˇstevila rojstev za specifiˇcno uro v dnevu omogoˇca boljˇse planiranje babiˇskega in zdravstvenega osebja [11]. Identificiramo lahko tudi patoloˇske lastnosti predˇcasnih rojstev [10]. Iz analize prometnih podatkov lahko razberemo obnaˇsanje populacije in vpliv sprememb skozi ˇcas, sploh v primeru globalne pandemije [3]. Tovrstne ana- lize so zato uporabne tudi za ekonomiste, inˇzenirje in ostale, katerih glavni cilj ni zgolj analiza bioloˇskih ritmov.

Za analizo ˇstevnih cirkadianih podatkov so potrebne posebne raˇcunske metode, ki upoˇstevajo in ohranjajo odnose med podatki. Metode za ana- lizo cirkadianih ritmov lahko uvrstimo med metode za analizo ˇcasovnih vrst.

Konkretneje so osredotoˇcene na analizo podatkov, ki so bili zbrani ob doloˇceni uri [14]. Pri ˇstevnih podatkih gre za dodatno ˇstetje pojavnosti dogodka.

Opiˇsemo ga lahko z diskretnimi porazdelitvami, ki so omejene na nenega- tivne vrednosti. Pri uporabi navadne linearne regresije nad takimi podatki se pojavijo problemi. Precej verjetno je, da nam bo model napovedal ne- gativne vrednosti, kar je teoretiˇcno nemogoˇce. Tudi veljavnost testiranja hipotez pri linearni regresiji temelji na varianci, kar je pri ˇstevnih podatkih teˇzko verjetno [8]. Zato potrebujemo posebne raˇcunske metode. Za ana- lizo cirkadianih podatkov z ritmiˇcno pojavnostjo moramo zdruˇziti metode za detekcijo ritma z metodami za analizo ˇstevnih podatkov.

Poznamo tudi neparametriˇcne metode za identifikacijo in analizo ritmi- ˇcnih podatkov, vendar ima klasiˇcna trigonometriˇcna regresija, ki temelji na

(17)

Diplomsko delo 3 razliˇcnih cosinor modelih, ˇse vedno kar nekaj prednosti v primerjavi z nepa- rametniˇcnimi metodami. Na primer, ˇce ˇzelimo oceniti ritmiˇcne parametre kot so amplituda, akrofaza itd. potem je uporaba metode cosinor zaˇzelena.

Uporabna je tudi takrat, ko imamo opravka z veliko podatki, ki vsebujejo osamelce (angl. outliers), so neuravnoteˇzeni in so zbrani brez ponovitev [15].

Obstajajo razliˇcne programske knjiˇznice, ki omogoˇcajo analizo podatkov z metodo cosinor. Napisane so veˇcinoma v programskih jezikih R in Python (glej npr. [12, 13]). ˇCetudi omogoˇcajo uporabo kar nekaj funkcionalnosti uporabnih tudi za ˇstevne podatke, so v glavnem namenjene analizi podatkov z zveznimi spremenljivkami.

Cilj tega dela je pregled in opis raˇcunskih metod za analizo cirkadianih ˇstevnih podatkov. Za analizo cirkadianih podatkov uporabimo metodo cosi- nor, ki jo kombiniramo z razliˇcnimi metodami za analizo ˇstevnih podatkov.

Predstavljene raˇcunske pristope testiramo in ovrednotimo na realnih podat- kih, in sicer na prometnih podatkih ljubljanske juˇzne obvoznice in ˇSmartinske ceste. Zaradi ekstremnih razmer v povezavi s COVID-19 smo delali s podatki iz leta 2019. Podatke iz leta 2020 smo uporabili le za primerjavo prome- tnih razmer v podpoglavju Analiza trenda prometnih podatkov. Podatki so javno dostopni, posredovalo pa nam jih je Ministrstvo za infrastrukturo.

Za dobljene prometne rezultate smo skuˇsali poiskati ustrezno razlago in jih interpretirati na ustrezen naˇcin z uporabo najprimernejˇsih modelov.

Delo je razdeljeno na pet poglavij. V drugem poglavju so teoretiˇcno predstavljene raˇcunske metode in modeli ter opisani podatki, na katerih smo modele uˇcili in testirali. Podrobno je predstavljen potek celotne raˇcunske metode. V poglavju Rezultati so prikazani in ovrednoteni dobljeni rezul- tati. Narejena je tudi analiza trenda prometnih podatkov. Sledi poglavje Diskusija, kjer so interpretirani rezultati raˇcunskih modelov. V zakljuˇcku so izpostavljene glavne ugotovitve.

(18)

4 Nina Velikajne

(19)

Poglavje 2 Metode

Delo se posveˇca modeliranju ˇstevnih podatkov v kombinaciji z metodo cosi- nor, ki je namenjena analizi cirkadianih podatkov. V nadaljevanju slednjo predstavimo nekoliko natanˇcneje. Sledi predstavitev petih raˇcunskih mode- lov, ki smo jih uporabili za modeliranje prometnih podatkov. To so Poissonov model (angl. Poisson model), generaliziran Poissonov model (angl. genera- lized Poisson model), Poissonov model z inflacijo niˇcel (angl. zero-inflated Poisson model), negativen binomski model (angl. negative binomial model) in negativen binomski model z inflacijo niˇcel (angl. zero-inflated negative binomial model).

2.1 Analiza cirkadianih podatkov

Cirkadiani podatki so torej periodiˇcni podatki, kjer se opazovani vzorci pona- vljajo vsakih 24 ur. Matematiˇcna in statistiˇcna analiza ˇcasovnih vrst je kom- pleksna in zahteva posebne tehnike. Naslovimo jo lahko tudi kot regresijski problem. Kadar imamo opravka z dolgimi ˇcasovnimi vrstami, lahko karakte- ristike cirkadianih ritmov variirajo s ˇcasom. S tem se spoprimemo tako, da ˇcasovno vrsto razdelimo na dele in analiziramo enega za drugim. Za detekcijo ritma v ˇcasovnih vrstah potrebujemo raˇcunske metode, ki upoˇstevajo pov- preˇcne vrednosti, varianco nihanja, amplitudo in ostale karakteristike ritma

5

(20)

6 Nina Velikajne [14]. V nadaljevanju bo omenjenih kar nekaj strokovnih izrazov, ki pa so kljuˇcni za detekcijo ritma, zato jih bomo na kratko opisali, da bo delo bolj razumljivo:

• MESOR (angl. Midline Estimating Statistic of Rhythm) – srednja vre- dnost ritma,

• amplituda (angl. amplitude) – najveˇcji odmik ali odklon od vrednosti MESOR,

• perioda (angl. period) – ˇcas znotraj katerega se ritem ponovi.

Za laˇzjo predstavo so karakteristike prikazane tudi na Sliki 2.1.

referenčničas čas amplituda,A

perioda,P Y

Slika 2.1: Prikaz karakteristik ritma. Slika je povzeta po viru [6].

(21)

Diplomsko delo 7

2.1.1 Metoda cosinor

Metodo cosinor so najprej razvili za analizo majhnega ˇstevila redkih (angl.

sparsed) podatkov. Uveljavila se je tudi za analizo velikih ˇcasovnih vrst in se tako fokusira tako na detekcijo ritma kot tudi na ocenitev parametrov ritma [6]. Metoda upoˇsteva ˇstevilo komponent in je sestavljena iz kosinusnih in sinusnih krivulj znane periode, npr. 24 ur v primeru cirkadianih podatkov.

Vsaka komponenta ima svojo periodo, ki predstavlja delitelj glavne periode.

Model lahko uporabimo tudi v primeru, ko je v podatkih prisoten ˇsum [14].

Zapiˇsemo ga z enaˇcbo:

Y(t) = M +

N

X

i=1

Ai,1 ·sin

2π t P/i

+Ai,2·cos

2π t P/i

+e(t) (2.1) kjer je N ˇstevilo komponent, M MESOR, A amplituda, P perioda in e(t) funkcija napake. V kolikor je perioda ritma vnaprej znana, se lahko enaˇcbo modela poenostavi v model linearne regresije:

Y(t) =M +

N

X

i=1

(Ai,1·xi,1 +Ai,2·xi,2) +e(t), (2.2) kjer je xi,1 = sin

P /it

, xi,2 = cos

P /it

, N ˇstevilo komponent, M MESOR, A amplituda, P perioda in e(t) funkcija napake [12].

Ce perioda ni znana, lahko preizkusimo veˇˇ c razliˇcnih period ali pa upo- rabimo tehnike za detekcijo in ocenitev periode, npr. periodograme [14].

2.2 Analiza ˇ stevnih cirkadianih podatkov

ˇStevni cirkadiani podatki so podatki s periodo 24 ur in so ˇstevnega tipa.

Za analizo teh podatkov potrebujemo posebne raˇcunske metode, ki zdruˇzu- jejo detekcijo ritma z analizo ˇstevnih podatkov. V ta namen izvorne podatke najprej transformiramo s pomoˇcjo zgoraj omenjene metode cosinor. V naˇsem primeru je perioda podatkov vnaprej znana, zato lahko uporabimo Enaˇcbo 2.2, kar nas privede do regresijskega problema. Da bi reˇsili regresijski problem potrebujemo regresijski raˇcunski model.

(22)

8 Nina Velikajne Regresijski modeli so pomembni raˇcunski modeli za analizo podatkov.

Omogoˇcajo tako identifikacijo kot tudi karakterizacijo odnosov med mnogimi faktorji, kot je izraˇcun ocen tveganja (angl. risk scores) za doloˇceno napoved.

Model opisuje odnose med odvisnimi in neodvisnimi spremenljivkami na poe- nostavljen matematiˇcni naˇcin. Najbolj poznani regresijski modeli so linearna (angl. linear regression), logistiˇcna (angl. logistic regression) in regresija Cox (angl. Cox regression) [16]. Ker pa imamo opravka s posebnim tipom podat- kov, tj. ˇstevnimi podatki, moramo uporabiti raˇcunske modele, ki ohranjajo lastnosti ˇstevnih podatkov. Modeli morajo upoˇstevati diskretno porazdelitev in imeti vrednosti omejene le na nenegativna ˇstevila. Pomembno je tudi, da upoˇstevajo poveˇcano (angl. overdispersion) ali pomanjˇsano razprˇsitev (angl.

underdispersion) podatkov [8]. Raˇcunski regresijski modeli, ki so primerni za analizo ˇstevnih podatkov, so natanˇcneje opisani v naslednjih poglavjih.

Z apliciranjem ustreznega regresijskega raˇcunskega modela reˇsimo Enaˇcbo 2.2. Rezultat celotne raˇcunske metode je nauˇcen raˇcunski model, preko kate- rega dobimo karakteristike in dober pribliˇzek parametrov ritma. Z dobljenimi rezultati in modelom si nato lahko pomagamo pri simulaciji in napovedovanju novih vrednosti.

2.3 Analiza raˇ cunskih modelov za ˇ stevne po- datke

V nadaljevanju bomo predstavili pet raˇcunskih modelov, ki se pogostokrat uporabljajo za modeliranje ˇstevnih podatkov. Poleg opisanih modelov se pojavljajo tudi drugi, kot so npr. modeli Hurdle (angl. Hurdle models) in razliˇcni modeli z odstranjenimi niˇclami (angl. zero-truncated models).

Vsak model ima prednosti pri doloˇceni porazdelitvi podatkov. Pri ˇstevnih podatkih je poveˇcana (angl. overdispersion) ali pomanjˇsana razprˇsitev (angl.

underdispersion) zelo pogost pojav.

Pomanjˇsana razprˇsitev pomeni, da imajo podatki manjˇso varianco kot bi jo priˇcakovali. Pojavi se, ko so skupine podatkov med seboj korelirane

(23)

Diplomsko delo 9 oziroma avtokorelirane. Poveˇcana razprˇsitev pa pomeni ravno nasprotno.

Podatki imajo veˇcjo varianco, kot bi je sicer priˇcakovali [8]. Poenostavljeno, ˇce je varianca veˇcja od povpreˇcja imajo podatki poveˇcano razprˇsitev in ˇce je varianca manjˇsa od povpreˇcja imajo podatki pomanjˇsano razprˇsitev [7].

Opisani modeli spadajo pod generalizirane linearne modele (angl. ge- neralized linear model, GLM) in so poenostavitev navadnega linearnega mo- dela. GLM je sestavljen iz treh elementov: funckije verjetnostne porazdelitve (angl. probability distribution), linearne napovedi (angl. linear predictor) in povezovalne funkcije (angl. link function). Funkcija verjetnostne porazdeli- tve opisuje verjetnostno porazdelitev opazovane spremenljivke. Povezovalna funkcija pa opisuje transformacijo, ki linearizira priˇcakovano vrednost opa- zovane spremenljivke g(µi) = ηi, kjer je ηi = PN

j=0βixij linearna napoved [8].

2.3.1 Poissonov model

Poissonov model predvideva, da so opazovani podatki porazdeljeni s Poisso- novo porazdelitvijo:

P(y=k) = λke−λ

k! , (2.3)

kjer je λ je povpreˇcna priˇcakovana vrednost oziroma ˇstevilo dogodkov na enoto ˇcasa. Povpreˇcje podatkov µ je pri Poissonovi porazdelivti enako pov- preˇcni priˇcakovani vrednostiλ. Variancaσ2pa je enaka povpreˇcju, torej velja, da je σ2=λ. Poissonov model poskuˇsa prilagoditi parameter λ linearnemu modelu. Parameter λ ˇse logaritmiramo zaradi posebnih zahtev, vrednosti morajo namreˇc zavzeli le nenegativna ˇstevila. To nas pripelje do naslednje enaˇcbe:

logei) = β01xi,1+...+βkxi,k. (2.4) Indeks i teˇce od 1 do konca uˇcne mnoˇzice, indeks k pa po ˇstevilu parame- trov modela. Cilj je poiskati povezavo med podatki in potencialnimi faktorji tveganja (angl. risk factors). Oceniti je treba regresijske koeficiente β [7, 8].

(24)

10 Nina Velikajne

2.3.2 Generaliziran Poissonov model

Generaliziran Poissonov model je razˇsiritev navadnega Poissonovega mo- dela predstavljenega v prejˇsnjem poglavju. Kljuˇcna razlika je, da ta model nima tako stroge omejitve in ne zahteva, da je povpreˇcje enako varianci.

Generaliziran Poissonov model je zato primeren za poveˇcano oziroma po- manjˇsano razprˇsene podatke. Vpeljemo dodaten parameter α, ki opisuje stopnjo razprˇsitve (angl. dispersion parameter). Primeren je tudi za po- datke brez razprˇsitve. V primeru, ˇce je α = 0 dobimo Poissonov model.

Ce jeˇ α >0 imamo opravka s poveˇcano razprˇsitvijo podatkov in obratno za pomanjˇsano razprˇsitev [5]. Obstajata dve razliˇcici generaliziranega Poisso- novega modela, in sicer GP-1 in GP-2. Uporabili smo razliˇcico GP-1, ker je dobljen model bolje ustrezal naˇsim podatkom. Model predvideva, da je odvisna spremenljivka y porazdeljena:

P(y=k) = e−(λ+αk)·(λ+αk)k−1

k! , (2.5)

kjer je povpreˇcje µenako 1−αλ in varianca σ2 = (1−α)λ 3. Parameter disperzije α pa je izraˇcunan po formuli:

α= PN

i=1

|y

iyˆi|

yˆi −1

·yˆi1−p

N −k−1 , (2.6)

kjer je N velikost uˇcne mnoˇzice, k ˇstevilo regresijskih spremenljivk, yi opa- zovana vrednost, ˆyi napovedana vrednost lambde λ za opazovano vrednost inp parameter, ki je v primeru modela GP-1 enak 1 [5].

2.3.3 Poissonov model z inflacijo niˇ cel

Veliko ritmiˇcnih dogodkov producira podatke, tako da je vrednost 0 zelo po- gosta, npr. ˇstevilo na novo odkritih planetov letno, tedensko ˇstevilo napadov morskih psov itd. To pomeni, da je vrednost 0 veliko bolj verjetna kot ostale vrednosti, ˇcesar navadni in generaliziran Poissonov model ne upoˇstevata.

Poissonov model z inflacijo niˇcel temelji na predpostavki, da obstajata dva

(25)

Diplomsko delo 11 dejavnika, ki vplivata na izid ali je ˇstevilo niˇcelno ali ne niˇcelno. Upoˇsteva naslednjo porazdelitev:

P(y=k) =

φi+ (1−φi)·e−λi, k= 0 (1−φieλik!·λki, k >0

, (2.7)

kjer je φ deleˇz niˇcel v i-ti vrstici podatkov, λi pa predstavlja priˇcakovano vrednost i-te vrstice. Indeksitorej teˇce od 1 do konca uˇcne mnoˇzice modela [9].

2.3.4 Negativen binomski model

Poissonov model in Poissonov model z inflacijo niˇcel imata zelo strogo ome- jitev. Povpreˇcje mora biti namreˇc enako varianci. Temu kriteriju podatki velikokrat ne ustrezajo, ker imajo poveˇcano ali pomanjˇsano razprˇsitev. Pri podatkih s poveˇcano razprˇsitvijo lahko uporabimo negativen binomski mo- del. Poznamo dve razliˇcici negativnega binomskega modela, in sicer NB-1 in NB-2, ki ju doloˇca parameter p. Uporabili smo NB-1.

Varianca takega modela je definirana kot σ2 =µ+α·µ kjer je α para- meter disperzije, µ pa povpreˇcje. Povpreˇcje je enako povpreˇcni priˇcakovani vrednosti λ. Z veˇcanjem parametra α varianca konvergira k povpreˇcju in negativna binomska porazdelitev postane Poissonova [1]. Parameterα lahko ocenimo s pomoˇcjo pomoˇzne OLS (angl. ordinary least squares, OLS) regre- sije. Izhajamo iz enaˇcb:

Y =B1x+B0, (2.8)

(yi−λi)2−λi λi

=α·λi+ 0, (2.9)

kjer leva stran predstavlja odvisno spremenljivko OLS regresije, α pa je re- gresijski koeficient. λ pridobimo s pomoˇcjo Poissonovega modela. Indeks i teˇce od 1 do konca uˇcne mnoˇzice modela. Ocenjejo vrednost parametra α preverimo, ˇce je statistiˇcno pomembna (angl. statistically significant) in jo uporabimo pri negativnem binomskem modelu [2].

(26)

12 Nina Velikajne Moˇzna parametrizacija verjetnostne funkcije za negativen binomski model je [1]:

P(y=k) = Γ(yi−1) Γ(α−1)Γ(yi+ 1)

1 1 +α·µi

α−1

α·µi 1 +α·µi

yi

. (2.10)

2.3.5 Negativen binomski model z inflacijo niˇ cel

Negativen binomski model z inflacijo niˇcel ima podobne lastnosti kot Poisso- nov model z inflacijo niˇcel, le da temelji na negativni binomski porazdelitvi.

Uporaben je pri podatkih, kjer imajo niˇcelne vrednosti veˇcjo verjetnost kot ostale vrednosti. V primerjavi s Poissonovim modelom z inflacijo niˇcel, ta upoˇsteva tudi poveˇcano razprˇsenost podatkov, ker izhaja iz negativnega bi- nomskega modela. Verjetnostna funkcija negativnega binomskega modela z inflacijo niˇcel izgleda tako:

P(y=k) =

τi+ (1−τi)·g(yi = 0), k = 0 (1−τi)·g(yi), k >0

, (2.11)

kjer jeτi = 1+λλi

i, λi pa je priˇcakovana vrednost, funkcija g(yi) pa predstavlja funkcijo iz Enaˇcbe 2.10. Indeks i teˇce od 1 do konca uˇcne mnoˇzice modela [9].

2.4 Analiza metod za vrednotenje modelov

Vrednotenje modelov poteka na dveh nivojih. Prvi del zajema iskanje opti- malnega ˇstevila komponent, ki temelji na vrednotenju gnezdenih modelov.

Drugi del zajema iskanje najbolj ustreznega tipa modela – na tem mestu upo- rabnik sam doloˇci test za vrednotenje, oziroma doloˇci ali so modeli gnezdeni (angl. nested) ali negnezdeni (angl. non-nested).

Za demonstracijo na podatkih smo najprej poiskali optimalno ˇstevilo kom- ponent, nato pa smo s pomoˇcjo testa za negnezdene modele poiskali ˇse najbolj ustrezen tip modela.

(27)

Diplomsko delo 13

2.4.1 Metode za vrednotenje gnezdenih modelov

Za primerjavo in iskanje najbolj ustreznega ˇstevila komponent smo upora- bili F test (Waldov test). Test se uporablja za primerjavo gnezdenih (angl.

nested) modelov [4].

Modela sta gnezdena, ˇce lahko prvi model na nek naˇcin izrazimo z dru- gim. Poenostavljeno, dva modela sta gnezdena, ˇce drugi model vsebuje vse parametre prvega modela in vsaj enega dodatnega. Veˇcji model je poln (angl.

complete, full), manjˇsemu modelu pa reˇcemo skrˇcen model (angl. reduced, restricted model) [4]. Glavna ideja testa je, da modele najprej zgradimo, nato pa preverimo, ˇce je vsaj eden od dodanih parametrov v polnem mo- delu razliˇcen od 0 glede na podano mejo za statistiˇcno signifikanco (angl.

statistical significance).

F test izvedemo po naslednji enaˇcbi:

F =

SS1−SS2

p2−p1 SS2

N−p2

, (2.12)

kjer je SS vsota kvadratov (angl. sum of squares), N velikost podatkovne mnoˇzince in pˇstevilo parametrov [4]. Za metodo cosinor jep= 2N+ 1, kjer je N ˇstevilo komponent. Prvi model zavrˇzemo, ˇce je F vrednost manjˇsa od neke vrednosti F porazdelitve – v naˇsem primeru 0.05.

2.4.2 Metode za vrednotenje negnezdenih modelov

Za vrednotenje negnezdenih modelov smo implementirali Vuongov test. Vuon- gov test je uporaben za primerjavo dveh poljubnih modelov, tj. modelaA in modela B. Modela sta lahko gnezdena, negnezdena ali pa celo prekrivajoˇca (angl. overlapping). Za negnezdene modele Z vrednost izraˇcunamo po sledeˇci formuli:

Z = LR(βA, βB) ω√

N , (2.13)

LR(βA, βB) = LA−LB−pA−pB

2 ·log (N), (2.14)

(28)

14 Nina Velikajne kjer jeLlogaritem najveˇcjega verjetja modela (angl. maximum log-likelihood), pˇstevilo parametrov modela, N velikost podatkovne zbirke in ω razlika kva- dratov istoleˇzeˇcih logaritmov verjetja (angl. pointwise log-likelihood ratio) [17]. Model A zavrˇzemo, ˇce je izraˇcunana Z vrednost manjˇsa od vnaprej doloˇcene meje, npr. 0.05 v naˇsem primeru.

2.5 Pridobitev in pregled testnih podatkov

Raˇcunske modele smo testirali na realnih podatkih, in sicer na javno dosto- pnih podatkih pridobljenih preko Direkcije RS za infrastrukturo. Izbrali smo si prometne podatke ljubljanske juˇzne obvoznice in ˇSmartinske ceste. Alter- nativa tem podatkom bi lahko bili tudi podatki s sistema Telraam1. Problem teh podatkov je, da zveˇcer zaradi teme kamere niso zmoˇzne beleˇziti prometa in so poslediˇcno podatki zelo netoˇcni.

Uporabljeni podatki so bili zajeti s pomoˇcjo prometnih ˇstevcev, ki na- tanˇcno beleˇzijo gostoto prometa. ˇStevci so razporejeni po celotni Sloveniji, podatke pa beleˇzijo za vsako uro v dnevu. Trenutni podatki ˇstevnih mest so javno dostopni na spletni strani2 in jih je mogoˇce brati preko programskega vmesnika (angl. application programmable interface, API). Zaradi razmer v povezavi s COVID-19 smo raˇcunske modele uˇcili in testirali na podatkih iz leta 2019. Podatki iz leta 2020 sluˇzijo zgolj za primerjavo prometnih razmer.

Direkcija RS za infrastrukturo nam je posredovala prometne podatke o letu 2019 in podatke iz aprila 2020. Preko API vmesnika smo vsak dan in vsako uro v mesecu novembru 2020 pridobivali in shranjevali tudi aktu- alne podatke. V ta namen smo primerjali tudi vpliv epidemioloˇskih razmer spomladi in jeseni v letu 2020 na naˇse dnevne navade.

1https://telraam.net

2https://www.promet.si/portal/sl/stevci-prometa.aspx

(29)

Diplomsko delo 15 Pridobljeni podatki so sledeˇce oblike:

id ˇcasovna oznaka avtomobili ... avtobusi skupna vsota vozil

178 1.1.2019 14:00 3 ... 4 25

Tovrstna oblika je podana za obe vozni smeri. Da smo delo poenostavili, smo za uˇcenje in testiranje raˇcunskih modelov uporabili skupno vsoto vozil obeh voznih smeri. Ta seˇstevek smo imenovali kar ˇstevilo vozil.

Za nadaljnjo analizo podatkov so bili vsakemu vnosu dodani podatki o vremenu. Vremenske podatke smo pridobili preko API klica s strani Visual Crossing Weather3.

Izbrani podatki so bili pred procesiranjem oˇciˇsˇceni. ˇCiˇsˇcenje podatkov je potekalo po urah, torej od 0 do 23. Za vsako uro smo odstranili vse vnose, kjer so bile vrednosti ˇstevil vozil veˇcje ali manjˇse od 0,15 kvantila. Primer vzorca oˇciˇsˇcenih podatkov prikazuje Slika 2.2.

V Tabeli 2.1 so prikazane lastnosti podatkov. Vidimo, da je varianca v obeh primerih precej veˇcja od povpreˇcja. To pomeni, da imamo opravka s podatki, ki imajo poveˇcano razprˇsitev (angl. overdispersed). Na Sliki 2.2 opazimo tudi, da izvorni podatki ne vsebujejo pretirano veliko 0. Niˇcelne vrednosti so zelo redke.

juˇzna lj. obvoznica ˇSmartinska cesta

povpreˇcje µ 3058 656

varianca σ2 3374586 238459

Tabela 2.1: Prikaz lastnosti podatkov.

Ker imajo podatki poveˇcano razprˇsitev in so niˇcelne vrednosti zelo redke, lahko sklepamo, da se bo najbolje prilegal generaliziran Poissonov model ali pa negativen binomski model.

3https://rapidapi.com/visual-crossing-corporation-visual-crossing- corporation-default/api/visual-crossing-weather/endpoints

(30)

16 Nina Velikajne

Slika 2.2: Prikaz vzorca oˇciˇsˇcenih izvornih podatkov. Iz podatkov smo za posamezno uro odstranili osamelce.

(31)

Diplomsko delo 17

2.6 Postopek celotne raˇ cunske metode

Celoten postopek raˇcunske metode se ponovi za vsako podatkovno zbirko.

Podatkov nismo delili na uˇcno in testno mnoˇzico. Celotna podatkovna zbirka je sluˇzila kot uˇcna mnoˇzica. Ukvarjamo se z analizo podatkov in v takih primerih uporabimo samo uˇcne podatke, ker iˇsˇcemo model, ki bo sluˇzil za ˇcimboljˇso interpretacijo podatkov.

Izvorne podatke preberemo in oˇcistimo kot je opisano v Poglavju 2.5.

Nato podatke s pomoˇcjo metode cosinor (glej Poglavje 2.1.1) transformiramo.

Metoda cosinor nam vrne tudi generiˇcne testne podatke v obliki signala.

Tovrstne podatke laˇzje prikazujemo in na njih laˇzje ocenimo karakteristike ritma. Dobimo regresijski problem, ki ga reˇsimo tako, da na transformirane podatke apliciramo regresijske raˇcunske modele (glej Poglavje 2.3). Rezultat postopka je nauˇcen raˇcunski model. Dobimo napovedane vrednosti ˇstevil vozil za vsako uro v dnevu. Ocenimo parametre ritma in vsak raˇcunski model tudi izriˇsemo. Celoten postopek se ponovi za posamezen raˇcunski model in za posamezno ˇstevilo komponent. Modele nato primerjamo med seboj.

Sprehodimo se ˇcez vse zgrajene modele in ohranimo le najbolj ustreznega, druge zavrˇzemo. Najprej poiˇsˇcemo optimalno ˇstevilo komponent na podlagi F testa (glej Poglavje 2.4.1). Nato se lotimo iskanja najbolj ustreznega tipa modela. Tu lahko izbiramo med dvema testoma, tj. F test in Vuongov test (glej Poglavje 2.4.2). Dobimo najbolj ustrezen tip raˇcunskega modela z optimalnim ˇstevilom komponent.

Za nazornejˇso predstavo smo celoten postopek predstavili tudi v obliki algoritma (glej Algoritem 1).

(32)

18 Nina Velikajne Algoritem 1: Raˇcunska metoda za analizo ˇstevnih cirkadianih po-

datkov.

Izhod: najModel podatki = preberi();

tipiModelov = [’poisson’, ’gen poisson’, ’zeros poisson’, ’nb’,

’zeros nb’];

stKomponent = [1,..., N];

modeli = [];

for tipModela in tipiModelov do for stevilo in stKomponent do

transformiraniPodatki, signal = cosinor(podatki, stevilo);

model = zgradiModel(transformiraniPodatki, tipModela);

napoved = model.napovej(transformiraniPodatki);

signalTest = model.napovej(signal);

modeli.dodaj(model);

oceniParametreRitma(signalTest);

narisiModel(signal, signalTest);

end end

najStKomponentModel = modeli[0];

for model in modeli do

najStKomponentModel=Ftest(najStKomponentModel, model);

end

najTipModelaModel = modeli[0];

for model in modeli do

najTipModelaModel=VuongTest(najTipModelaModel, model);

end

najModel = modeli[

modeli.stKomponent == najStKomponentModel.stKomponent &

modeli.tipModela == najTipModelaModel.tipModela ];

(33)

Poglavje 3 Opis analize

Celotno raˇcunsko metodo smo napisali v programskem jeziku Python. Pri implementaciji metode cosinor smo si pomagali s knjiˇznico CosinorPy [12], raˇcunske modele pa smo uvozili iz knjiˇznice statsmodels1. Celotna koda je javno dostopna na GitHubu2.

3.1 Rezultati raˇ cunskih modelov

Podatke smo naprej oˇcistili tako, da smo odstranili osamelce (angl. outliers).

Na podatkih smo zgradili raˇcunske modele predstavljene v Poglavju 2.3. Za vsak raˇcunski model smo pri metodi cosinor preizkusili veˇc razliˇcnih ˇstevil komponent. Raˇcunske metode smo najprej izvedli za podatke juˇzne ljubljan- ske obvoznice (glej Sliko 3.1). Vse modele smo testirali za ˇstevila komponent od 1 do 9. Pri 9 smo se ustavili, ker se je izkazalo, da se prilagojena kri- vulja (angl. fitted curve) ne spreminja veˇc veliko. Celotno raˇcunsko metodo smo ponovili ˇse na mestnih prometnih podatkih pridobljenih na ˇSmartinski cesti (glej Sliko 3.2). Model smo zgradili za ˇstevila komponent od 1 do 7.

Pri ˇstevilu komponent 7 se je namreˇc izkazalo, da se prilagojena krivulja ne spreminja veˇc veliko. Optimizacijske metode za optimiziranje raˇcunskih mo-

1https://www.statsmodels.org/stable/index.html

2https://github.com/ninavelikajne/Ritmicnost-pojavnih-dogodkov

19

(34)

20 Nina Velikajne delov so ˇze integrirane v knjiˇznici statsmodels3. Pri grajenju modelov smo uporabili optimizacijsko metodo Nelder-Mead. Ta optimizacijska metoda je najbolj ustrezala naˇsim podatkom. Da bi bili pogoji za gradnjo modelov ˇcimbolj enaki, smo ˇstevilo iteracij pri vseh modelih omejili na enako ˇstevilo, tj. 5000.

3https://www.statsmodels.org/stable/index.html

(35)

Diplomsko delo 21

Slika 3.1: Zgrajeni raˇcunski modeli juˇzne ljubljanske obvoznice iz leta 2019.

N v legendi predstavlja ˇstevilo komponent.

(36)

22 Nina Velikajne

Slika 3.2: Zgrajeni raˇcunski modeli za podatke ˇSmartinske ceste iz novembra 2019. N v legendi predstavlja ˇstevilo komponent.

(37)

Diplomsko delo 23

3.2 Ovrednotenje raˇ cunskih modelov

Na Slikah 3.1 in 3.2 so prikazane prilagojene krivulje in raˇcunski modeli za obe podatkovni zbirki. Na prvi pogled so si nekateri modeli med seboj zelo podobni. Ovrednotenje modelov je potekalo na dveh nivojih (glej Poglavje 2.4). Najprej smo poiskali optimalno ˇstevilo komponent tako, da smo se sprehodili ˇcez vse modele in jih primerjali na podlagi F testa. Rezultat prve primerjave je optimalno ˇstevilo komponent. Na drugem nivoju smo iskali najbolj ustrezen tip raˇcunskega modela. Sprehodili smo se ˇcez modele in jih primerjali na podlagi Vuongovega testa. Dobimo najbolj ustrezen tip raˇcunskega modela z optimalnim ˇstevilom komponent.

Na podlagi opravljenih testov smo ugotovili, da je za naˇse podatke naj- bolj ustrezen generaliziran Poissonov model. ˇStevili komponent za metodo cosinor pa se za zbirki podatkov razlikujeta (glej Sliko 3.3). Za podatke juˇzne ljubljanske obvoznice se najbolje prilega krivulja, ki uporablja 7 komponent.

Za podatke ˇSmartinske ceste pa se izkaˇze, da je najbolj optimalna krivulja s 5 komponentami.

Vrhove ritma smo zaznali s pomoˇcjo Python knjiˇznice scipy4. Uporabili smo vrednosti, ki so veˇcje odM ESOR·0.8.

lokacija tip modela N amplituda mesor vrhovi viˇsine amplituda CIs mesor CIs vrhovi CIs viˇsine CIs ˇSmartinska

cesta gen poisson 5.0 603.35 631.22 11.01 16.42

1233.69

1234.58 597.74 614.52 625.35 642.87 10.71 11.22 16.1 16.74

1223.06 1241.49 1212.03 1261.45 lj. juˇzna

obvoznica gen poisson 7.0 2522.45 3042.06 7.11 15.32

4508.4

5564.5 2483.18 2563.46 2999.75 3080.61 6.98 7.28 15.2 15.42

4336.79 4647.9 5484.26 5642.74

Tabela 3.1: Karakteristika ritmov za obe lokaciji oz. podatkovni zbirki.

Tip modela oznaˇcuje najbolj ustrezen tip raˇcunskega modela, N pa opti- malno ˇstevilo komponent. gen poisson oznaˇcuje generaliziran Poissonov mo- del. Oznake CIs predstavljajo izraˇcunane intervale zaupanja.

4https://docs.scipy.org/doc/scipy/reference/signal.html/

(38)

24 Nina Velikajne

Slika 3.3: Najbolj ustrezna raˇcunska modela z optimalnim ˇstevilom kompo- nent za obe podatkovni zbirki. Za lj. juˇzno obvoznico je to generaliziran Poissonov model s 7 komponentami, za ˇSmartinsko cesto pa generaliziran Poissonov model s 5 komponentami. V ozadju so s prosojno oranˇzno barvo narisani intervali zaupanja modelov. Ostali podatki o raˇcunskih modelih se nahajajo v Tabeli 3.1.

(39)

Diplomsko delo 25

3.3 Analiza trenda prometnih podatkov

Detekcijo ritma in raˇcunske modele smo testirali na realnih prometnih po- datkih. Teh podatkov nismo oˇcistili z odstranitvijo vikendov ali pa loˇcitev sonˇcnih in deˇzevnih dni. Ker pa vse omenjeno vpliva na ritem naˇsega ˇzivljenja, se to odraˇza tudi v prometnih podatkih. Celotno vzpostavljeno metodolo- gijo (glej npr. Algoritem 1) smo nazadnje uporabili za primerjavo ritmov v odvisnosti od razliˇcnih dejavnikov. Primerjali smo kako na naˇs ritem vpliva dan v tednu, vreme in epidemija COVID-19. Analizirali smo tudi ritem za razliˇcne kategorije vozil. Vse primerjave so bile izvedene le za podatke juˇzne ljubljanske obvoznice. Za primerjavo epidemioloˇskih razmer smo uporabili podatke iz prvega vala – april 2020 in drugega vala – november 2020.

3.3.1 Analiza vpliva dneva v tednu

Opazimo, da se ritem za nekatere dneve precej razlikuje od ostalih (glej Tabelo 3.2 in Sliko 3.4). Najprej primerjamo delovnik (glej Tabelo 3.2).

Opazimo, da se ritem od ostalih dni najbolj razlikuje ob petkih. Za po- nedeljek, torek, sredo in ˇcetrtek iz amplitude, vrednosti MESOR in viˇsin vrhov opazimo, da je ˇstevilo vozil pribliˇzno enako. Ob petkih se ˇstevilo vozil zmanjˇsa za pribliˇzno 10%. Drugi vrh se v petek pojavi pribliˇzno pol ure prej.

Sama oblika ritma je za vse dneve med delovnikom podobna (glej Sliko 3.4).

Sploˇsno gledano se med vsemi dnevi v delovniku prvi vrh pojavi okoli 7. ure, drugi pa okoli 15. oziroma 16. ure. Med vrhovoma je pribliˇzno 8 ur razlike, zato lahko sklepamo, da je ritem med delovnikom preteˇzno zaznamovan z 8-urnim delovnikom.

Za vikende se ˇstevilo vozil v primerjavi z delovnikom zmanjˇsa za skoraj 40% (glej Tabelo 3.2). Tudi lokacije vrhov se spremenijo. V soboto se poja- vijo trije vrhovi – prvi okoli 11. ure, drugi okoli 13. ure in zadnji med 16.

in 17. uro. V nedeljo se pojavita samo dva vrhova – prvi okoli 13. ure in drugi okoli 17. ure. Obliki ritmov sta si ob sobotah in nedeljah precej po- dobni (glej Sliko 3.4). Najbolj ustrezen tip modela je za vse dneve enak, tj.

(40)

26 Nina Velikajne generaliziran Poissonov model, medtem ko se optimalno ˇstevilo komponent spreminja. Za delovnike je optimalno ˇstevilo komponent 7, za vikende pa 6.

Na podlagi prejˇsnjih ugotovitev opazimo, da imajo dnevi med tednom, tj. delovnikom, obˇcutno drugaˇcen ritem kot dnevi med vikendom, zato smo izvedli dodatno analizo in tako primerjali le delovnike in vikende (glej Tabelo 3.3 in Sliko 3.5). Na podlagi primerjave delovnika in vikenda ugotovimo po- dobno. Ob vikendih se ˇstevilo vozil zmanjˇsa za skoraj 40%, lokacije vrhov pa se razlikujejo. V soboto in nedeljo ne opazimo dveh vrhov, ki zaznamujeta vse delovne dneve.

dan tip modela N amplituda mesor vrhovi viˇsine amplituda CIs mesor CIs vrhovi CIs viˇsine CIs torek gen poisson 7.0 2956.52 3394.3 6.81

15.32 5535.29

6350.82 2889.71 3012.16 3337.75 3450.36 6.75 6.95 15.26 15.42

5347.6 5654.14 6229.47 6460.52 sreda gen poisson 7.0 2932.5 3378.71 6.81

15.32 5628.9

6311.21 2855.21 3017.15 3290.1 3468.98 6.68 6.92 15.26 15.45

5419.57 5931.35 6146.49 6484.95 ˇ

cetrtek gen poisson 7.0 3033.42 3472.75 6.91 15.32

5516.82

6506.17 3006.96 3060.39 3442.49 3507.38 6.73 7.07 15.26 15.43

5344.72 5657.54 6453.14 6564.07 petek gen poisson 7.0 2583.05 3064.18 6.81

14.91 5228.47

5647.23 2536.8 2639.71 3012.74 3116.24 6.74 7.05 14.63 15.13

4928.06 5551.78 5550.98 5752.38

sobota gen poisson 6.0 1830.34 2358.22 10.91 12.91 16.62

4173.29 4188.56 4138.89

1822.95 1852.5 2347.35 2387.15

9.39 13.27 11.42 14.24 16.31 16.91

4165.33 4234.31 4162.53 4232.15 4103.49 4199.69 nedelja gen poisson 6.0 1873.71 2315.18 12.51

16.92 4125.95

4188.89 1841.88 1913.04 2290.65 2342.92 11.99 12.79 16.68 17.05

4094.31 4182.68 4123.79 4260.18 ponedeljek gen poisson 7.0 2919.26 3401.57 6.81

15.42 5666.19

6320.82 2870.8 2965.27 3350.64 3450.19 6.76 6.96 15.34 15.47

5498.46 5848.58 6222.6 6414.29

Tabela 3.2: Karakteristike ritma glede na vpliv dneva v tednu. Tip modela oznaˇcuje najbolj ustrezen tip raˇcunskega modela, N pa optimalno ˇstevilo komponent. gen poisson oznaˇcuje generaliziran Poissonov model. Oznake CIs predstavljajo izraˇcunane intervale zaupanja.

(41)

Diplomsko delo 27

Slika 3.4: Zgrajeni modeli glede na dan v tednu. Podatki o raˇcunskih modelih se nahajajo v Tabeli 3.2.

(42)

28 Nina Velikajne

dan tip modela N amplituda mesor vrhovi viˇsine amplituda CIs mesor CIs vrhovi CIs viˇsine CIs delovnik gen poisson 10.0 2853.39 3309.42 6.91

15.22 5443.8

6162.81 2826.83 2881.28 3286.5 3333.2 6.81 6.99 15.1 15.3

5289.5 5557.71 6114.37 6213.44 vikend gen poisson 6.0 1836.91 2326.76 12.61

16.82 4163.67

4155.84 1823.87 1862.67 2318.43 2350.1 11.26 13.4 16.55 17.02

4131.22 4210.7 4121. 4194.42

Tabela 3.3: Karakteristike ritma glede delovnik in vikend. Tip modela oznaˇcuje najbolj ustrezen tip raˇcunskega modela, N pa optimalno ˇstevilo komponent. gen poisson oznaˇcuje generaliziran Poissonov model. Oznake CIs predstavljajo izraˇcunane intervale zaupanja.

Slika 3.5: Zgrajeni modeli glede na vikend in delovnik. Podatki o raˇcunskih modelih se nahajajo v Tabeli 3.3.

(43)

Diplomsko delo 29

3.3.2 Analiza vpliva vremena

Podatkom smo dodali informacijo o vremenu in izvedli dodatno analizo z namenom, da bi ugotovili kako vreme vpliva na ritem na ljubljanski juˇzni obvoznici. Iz amplitude, vrednosti MESOR in viˇsin vrhov opazimo, da se v primeru slabega vremena (tj. deˇz, sneg, megla) ˇstevilo vozil poveˇca za pribliˇzno 5% (glej Tabelo 3.4). Tudi lokacije vrhov so premaknjene za pri- bliˇzno 0.2 ure naprej. Oblika ritma ostane nespremenjena (glej Sliko 3.6).

Optimalni ˇstevili komponent se razlikujeta. V primeru slabega vremena je to ˇstevilo 5, v nasprotnem primeru pa 7. Tip modela pa je v obeh primerih enak – generaliziran Poissonov model.

vreme tip modela N amplituda mesor vrhovi viˇsine amplituda CIs mesor CIs vrhovi CIs viˇsine CIs jasno, rahla

oblaˇcnost gen poisson 7.0 2488.22 2993.44 7.01 15.22

4506.26 5481.66

2437.6

2542.82 2940.07 3052.31 6.87 7.21 15.1 15.4

4308.21 4667.88 5378.34 5594.46 deˇz, sneg,

megla gen poisson 5.0 2612.46 3108.36 7.21 15.42

4557.78 5720.82

2549.77

2685.73 3022.48 3169.34 7.07 7.38 15.34 15.61

4402.93 4728.05 5595.61 5831.7

Tabela 3.4: Karakteristike ritma glede na vpliv vremena. Tip modela oznaˇcuje najbolj ustrezen tip raˇcunskega modela, N pa optimalno ˇstevilo komponent. gen poisson oznaˇcuje generaliziran Poissonov model. Oznake CIs predstavljajo izraˇcunane intervale zaupanja.

(44)

30 Nina Velikajne

Slika 3.6: Zgrajeni modeli glede na vpliv vremena. Podatki o raˇcunskih modelih se nahajajo v Tabeli 3.4.

3.3.3 Analiza glede na kategorijo vozila

Izvedli smo primerjavo glede na kategorijo vozila. ˇStevci ˇstejejo vozila za naslednje kategorije: motorji, avtomobili, avtobusi, lahka tovorna vozila, srednja tovorna vozila, teˇzka tovorna vozila, tovorna vozila s priklopniki in vlaˇcilci. Motorje in avtomobile smo zdruˇzili v kategorijo ”osebna vozila”, av- tobusi so kategorija ”avtobusi”, vse ostale pa smo ˇsteli v kategorijo ”tovornih vozil”.

V Tabeli 3.5 so prikazane karakteristike ritmov za vsako kategorijo. Na podlagi vrednosti MESOR, amplitude in vrhov lahko razberemo, da prevla- dujejo osebna vozila. Njihov ritem zaznamuje delovnik, vrhovi se pojavijo okoli 7. in 15. ure. Tudi sama oblika ritma (glej zgornji graf Slike 3.7) je podobna ritmom iz prejˇsnjih primerjav. Pri tovornih vozilih se pojavita dva

(45)

Diplomsko delo 31 vrhova prvi med 7. in 8. uro, drugi pa okoli 13. ure. Na Sliki 3.7 opazimo, da je ˇstevilo tovornih vozil porazdeljeno skoraj konstantno med 7. in 17. uro.

Z vrednosti MESOR, amplitude in viˇsine vrhov opazimo, da je na ljubljanski juˇzni obvoznici najmanj avtobusov. Ritem ima dva vrhova, prvega okoli 8.

ure in drugega okoli 16. ure. Sklepali bi lahko, da je tudi ta ritem deloma zaznamovan s potrebo ˇsolanja in dela. Na spodnjem grafu Slike 3.7 vidimo, da je frekvenca avtobusov z izjemo vrhov skoraj konstantna ˇcez cel dan. Op- timalno ˇstevilo komponent in najbolj ustrezen tip raˇcunskega modela je enak za vse navedene primere.

kategorija

vozila tip modela N amplituda mesor vrhovi viˇsine amplituda CIs mesor CIs vrhovi CIs viˇsine CIs osebna v. gen poisson 7.0 2244.54 2499.22 7.01

15.32 3564.67

4743.77 2227.7 2273.76 2482.71 2525.77 6.9 7.07 15.26 15.42

3566.07 3632.96 4711. 4798.95 avtobusi gen poisson 7.0 4.03 14.28 7.91

16.12 18.31

15.12 3.7 4.42 13.91 14.65 7.77 7.97 14.79 17.04

17.63 19.03 14.84 15.6 tovorna v. gen poisson 7.0 371.74 594.17 7.41

13.11 965.91

906.24 347.5 394.47 575.95 614.86 7.05 7.8 12.67 13.69

924.23 1008.55 876.77 941.35

Tabela 3.5: Karakteristike ritma glede na kategorijo vozil. Tip modela oznaˇcuje najbolj ustrezen tip raˇcunskega modela, N pa optimalno ˇstevilo komponent. gen poisson oznaˇcuje generaliziran Poissonov model. Oznake CIs predstavljajo izraˇcunane intervale zaupanja.

(46)

32 Nina Velikajne

Slika 3.7: Zgrajeni modeli glede na kategorijo vozil. Podatki o raˇcunskih modelih se nahajajo v Tabeli 3.5.

(47)

Diplomsko delo 33

3.3.4 Analiza vpliva epidemije COVID-19

Primerjali smo prometno stanje na ljubljanski juˇzni obvoznici med prvim in drugim valom epidemije COVID-19 v Sloveniji. Natanˇcneje, april 2019 in april 2020 – prvi val epidemije, in november 2019 in november 2020 – drugi val epidemije.

Najprej primerjamo april 2019 in april 2020. Iz amplitude, vrednosti ME- SOR in viˇsin vrhov opazimo, da se je ˇstevilo vozil med prvim valom zmanjˇsalo za pribliˇzno 60% (glej Tabelo 3.6). Prvi in zadnji vrh aprila 2020 sovpadata z vrhovoma aprila 2019. Med prvim valom se vrhova pojavita pribliˇzno 0.4 ure prej. V aprilu 2020 zaznamo nov vrh okoli 12. ure. Sama oblika ritma, z izjemo dodatnega vrha med prvim valom, ostane nespremenjena (glej levi graf Slike 3.8). Nato primerjamo samo delovnike med aprilom 2019 in apri- lom 2020. Opazimo, da se ˇstevilo vozil v aprilu 2020 zmanjˇsa za skoraj 50%

(glej Tabelo 3.7). Vrhova pa se pojavita pribliˇzno 0.4 ure prej. Oblika ritma ostane nespremenjena (glej levi graf Slike 3.9). Nazadnje primerjamo samo vikende aprila 2019 in aprila 2020. Opazimo, da se ˇstevilo vozil med vikendi aprila 2020 zmanjˇsa za pribliˇzno 70% (glej Tabelo 3.8). V aprilu 2019 za- znamo en vrh okoli 11:30, aprilu 2020 pa zaznamo dva vrhova. Prvega okoli 12. ure in drugega okoli 17:30. Spremeni se tudi oblika zaznanega ritma (glej levi graf Slike 3.10).

Podobno ugotovimo, ˇce primerjamo november 2019 in november 2020 (glej Tabelo 3.6). ˇStevilo vozil se veˇc kot prepolovi, lokacije vrhov pa se razlikujejo. Prvi in zadnji vrh v novembru 2020 sovpadata z vrhovoma za- znanima v novembru 2019, le da se pojavita kasneje – prvi vrh pribliˇzno 0.1 ure kasneje, drugi pa pribliˇzno 0.6 ure kasneje. V novembru 2020 se pojavi nov vrh okoli 12:30. Oblika zaznanega ritma, z izjemo novega vrha ob 12:30, ostane nespremenjena (glej desni graf Slike 3.8). Podobno ugoto- vimo, ˇce primerjamo samo delovnike med novembrom 2019 in novembrom 2020. ˇStevilo vozil se med delovniki v novembru 2020 prepolovi, vrhovi pa se premaknejo za pribliˇzno 0.4 ure naprej (glej Tabelo 3.7). Oblika zaznanega ritma ostane nespremenjena (glej desni graf Slike 3.9). Nazadnje primerjamo

(48)

34 Nina Velikajne samo vikende med novembrom 2019 in novembrom 2020. ˇStevilo vozil se je v novembru 2020 zmanjˇsalo za skoraj 65% (glej Tabelo 3.8). V novembru 2019 se pojavita dva vrhova – okoli 12. in 16 ure, v novembru 2020 pa samo en vrh – okoli 16. ure. Spremeni se tudi oblika zaznanega ritma (glej desni graf na Sliki 3.10).

Nazadnje primerjamo ˇse prvi in drugi val, tj. april 2020 in november 2020. Opazimo, da se je ˇstevilo vozil v novembru 2020 zviˇsalo za pribliˇzno 5% (glej Tabelo 3.6). ˇStevilo vrhov je v obeh primerih enako, opazimo pa da so v novembru 2020 vrhovi premaknjeni naprej. Prvi vrh in drugi vrh sta premaknjena za pribliˇzno 0.3 ure naprej, zadnji pa za pribliˇzno 1 uro naprej.

Oblika ritma ostane nespremenjena (glej Sliko 3.8). Podobno opazimo, ko primerjamo samo delovnike med prvim in drugim valom. ˇStevilo vozil je podobno v obeh primerih. Vrhova pa sta med drugim valom pomaknjena za pribliˇzno 0.85 ure naprej (glej Tabelo 3.7). Oblika zaznanega ritma ostane tudi v tem primeru nespremenjena (glej Sliko 3.9). Primerjamo ˇse vikende med prvim in drugim valom. Opazimo, da se ˇstevilo vozil v novembru 2020 poveˇca za pribliˇzno 20%. V aprilu 2020 sta zaznana dva vrhova – prvi ob 12.

uri in drugi okoli 17:30. V novembru 2020 pa je zaznan samo en vrh med 15. in 16. uro (glej Tabelo 3.8). Groba oblika zaznanih ritmov si je dokaj podobna (glej Sliko 3.10).

Ugotovimo, da se je ˇstevilo vozil med obema valoma epidemije znatno zmanjˇsalo. To lahko pojasnimo z ukrepi kot so delo od doma, omejitev gibanja na obˇcine in zaprtje trgovin, frizerskih salonov in ostalih storitev.

Opazimo tudi, da se kot najbolj ustrezen model vedno izkaˇze generaliziran Poissonov model, optimalno ˇstevilo komponent pa se spreminja za posamezen primer (glej Tabele 3.6, 3.7, 3.8).

(49)

Diplomsko delo 35

obdobje tip modela N amplituda mesor vrhovi viˇsine amplituda CIs mesor CIs vrhovi CIs viˇsine CIs april 2019 gen poisson 5.0 2522.18 3013.87 7.21

15.22 4919.8

5536.05 2428.07 2673.73 2920.09 3158.95 6.93 7.34 15.01 15.5

4639.54 5191.51 5349.19 5831.64 november 2019 gen poisson 5.0 2615.95 3063.8 7.31

15.32 4450.64

5679.76 2484.95 2702.68 2927.84 3148.17 6.95 7.67 15.16 15.53

4172.87 4772.73 5415.23 5848.4

april 2020 gen poisson 5.0 1065.9 1241.1 6.71 11.91 14.91

1933.04 2042.

2307.

978.6 1178.75 1160.3 1351.76

6.54 7.08 10.88 12.38 14.51 15.47

1753.26 2196.98 1959.31 2197.27 2136.65 2530.19

november 2020 gen poisson 5.0 1118.82 1371.95 7.41 12.21 15.92

2445.32 2057.38 2490.77

1058.49 1187.76 1314.14 1440.87 7.24 7.63 11.86 12.47 15.68 16.21

2288.23 2603.97 2003.07 2206.06 2339.67 2590.88

Tabela 3.6: Karakteristike ritma glede na vpliv epidemije COVID-19. Tip modela oznaˇcuje najbolj ustrezen tip raˇcunskega modela, N pa optimalno ˇstevilo komponent. gen poisson oznaˇcuje generaliziran Poissonov model.

Oznake CIs predstavljajo izraˇcunane intervale zaupanja.

obdobje tip modela N amplituda mesor vrhovi viˇsine amplituda CIs mesor CIs vrhovi CIs viˇsine CIs delovnik

april 2019 gen poisson 7.0 2995.54 3437.1 6.81 15.32

6217.27

6432.65 2922.1 3082.12 3360.66 3528.43 6.75 6.92 15.13 15.4

6164.76 6281.19 6283.24 6610.06 delovnik

november 2019 gen poisson 8.0 3084.91 3451.8 6.81 15.32

6052.79

6536.7 3041.84 3121.48 3402.82 3487.23 6.81 6.81 15.2 15.4

6015.89 6095.33 6445.35 6608.02 delovnik

april 2020 gen poisson 7.0 1452.39 1579.27 6.41 14.91

2892.09

3031.66 1388.67 1518.46 1511.96 1645.11 6.36 6.48 14.63 15.14

2827.18 2959.45 2900.76 3163.43 delovnik

november 2020 gen poisson 9.0 1454.56 1631.46 7.21 15.82

3086.02

2991.32 1427.22 1491.14 1605.11 1665.51 7.16 7.25 15.73 15.98

3030.59 3156.81 2946.47 3073.84

Tabela 3.7: Karakteristike ritma glede na vpliv epidemije COVID-19 samo med delovniki. Tip modela oznaˇcuje najbolj ustrezen tip raˇcunskega mo- dela, N pa optimalno ˇstevilo komponent. gen poisson oznaˇcuje generaliziran Poissonov model. Oznake CIs predstavljajo izraˇcunane intervale zaupanja.

obdobje tip modela N amplituda mesor vrhovi viˇsine amplituda CIs mesor CIs vrhovi CIs viˇsine CIs vikend

april 2019 gen poisson 2.0 1694.28 2326.76 11.21 4021.03 1641.31 1743.73 2291.41 2359.88 10.63 11.65 3946.61 4089.71 vikend

november 2019 gen poisson 3.0 1781.03 2272.28 11.61 15.72

4053.3

3998.37 1748.64 1817.62 2242.12 2314.94 11.31 12.

15.25 15.96

3964.7 4144.91 3957.78 4057.71 vikend

april 2020 gen poisson 3.0 483.76 582.08 12.01 17.22

1065.84

965.17 449.26 511.89 545.33 609.7 11.14 12.94 16.32 18.15

992.11 1122.53 934.72 1023.76 vikend

november 2020 gen poisson 2.0 604.73 799.73 15.72 1404.46 571.15 637.62 767.16 829.48 15.38 16.24 1339.96 1465.45

Tabela 3.8: Karakteristike ritma glede na vpliv epidemije COVID-19 samo med vikendi. Tip modela oznaˇcuje najbolj ustrezen tip raˇcunskega modela, N pa optimalno ˇstevilo komponent. gen poisson oznaˇcuje generaliziran Pois- sonov model. Oznake CIs predstavljajo izraˇcunane intervale zaupanja.

(50)

36 Nina Velikajne

Slika 3.8: Zgrajeni modeli na podlagi vpliva epidemije COVID-19.Podatki o raˇcunskih modelih se nahajajo v Tabeli 3.6.

Slika 3.9: Zgrajeni modeli na podlagi vpliva epidemije COVID-19 samo med delavniki. Podatki o raˇcunskih modelih se nahajajo v Tabeli 3.7.

(51)

Diplomsko delo 37

Slika 3.10: Zgrajeni modeli na podlagi vpliva epidemije COVID-19 samo med vikendi. Podatki o raˇcunskih modelih se nahajajo v Tabeli 3.8.

(52)

38 Nina Velikajne

(53)

Poglavje 4 Diskusija

Iz Slik 3.1 in 3.2 hitro opazimo, kateri raˇcunski modeli se dobro prilegajo prometnim podatkom. Vidimo, da se naˇs sklep iz Poglavja 2.5 na dobljenih rezultatih potrdi. Poissonov model se za obe podatkovni zbirki ne izkaˇze najbolje, ker podatki ne ustrezajo pogoju, da je povpreˇcje µenako varianci σ2 (glej Tabelo 2.1). Najslabˇse se izkaˇze Poissonov model z inflacijo niˇcel.

Podatki namreˇc ne ustrezajo pogoju µ=σ2 in ne vsebujejo pretirano veliko niˇcelnih vrednosti (glej Sliko 2.2). Negativen binomski model z inflacijo niˇcel se iz istega razloga kot Poissonov model z inflacijo niˇcel ne izkaˇze najbolje.

Podatki ne vsebujejo pretirano veliko vrednosti enakih 0. ˇSe vedno pa se izkaˇze bolje kot Poissonov model z inflacijo niˇcel, saj je primeren za podatke s poveˇcano razprˇsitvijo.

Teˇzave pri vseh omenjenih modelih se pojavijo z veˇcanjem ˇstevila kom- ponent (glej Sliki 3.1 in 3.2). Generaliziran Poissonov model in negativen binomski model pa sta za podatke s poveˇcano razprˇsitvijo idealna. Rezul- tata sta si na prosto oko zelo podobna (glej Sliki 3.1 in 3.2), vendar se kot najboljˇsi model izkaˇze generaliziran Poissonov model. Za prikaz natanˇcnosti smo izraˇcunali tudi intervale zaupanja modelov, ki so prikazani na Sliki 3.3.

Vidimo, da so intervali zaupanja ozki za obe podatkovni zbirki.

Najbolj ustrezno ˇstevilo komponent se za obe podatkovni zbirki razli- kuje. ˇZe na porazdelitvi izvornih podatkov (glej npr. Sliko 3.3) opazimo,

39

(54)

40 Nina Velikajne da so porazdeljeni drugaˇce in da se vrhovi podatkov razlikujejo. Za podatke ljubljanske obvoznice se je kot optimalno ˇstevilo komponent izkazalo ˇstevilo 7, za ˇSmartinsko cesto pa ˇstevilo 5.

Iz amplitude, vrednosti MESOR in viˇsin vrhov opazimo, da je ljubljan- ska juˇzna obvoznica bolj prometna kot ˇSmartinska cesta. Na ljubljanski juˇzni obvoznici je namreˇc 75% veˇc prometa kot na ˇSmartinski cesti (glej Tabelo 3.1). Tudi vrhovi se pojavljajo ob razliˇcnih urah. Na ljubljanski juˇzni ob- voznici se prvi vrh pojavi okoli 7. ure, drugi pa okoli 15. ure. Sklepamo lahko, da je ritem na ljubljanski juˇzni obvoznici v najveˇcji meri zaznamovan z vzorcem dela. Med prvim in drugim vrhom je pribliˇzno 8 ur razlike, kar lahko ponazarja 8-urni delovnik. Na ˇSmartinski cesti pa se vrhova pojavita kasneje. Pri okoli 11. ure in drugi med 16. in 17. uro. Tudi obliki zaznanih ritmov se veˇc kot oˇcitno razlikujeta (glej Sliko 3.3).

(55)

Poglavje 5 Zakljuˇ cek

V diplomskem delu smo vzpostavili metodologijo za analizo cirkadianih ˇstev- nih podatkov in implementirali zbirko funkcij, ki jih lahko potencialni upo- rabnik direktno uporabi pri analizi tovrstnih podatkov. Raˇcunska metoda je sestavljena iz dveh kljuˇcnih delov. Prvi del je analiza cirkadianih po- datkov, ta zajema metodo cosinor in transformacijo podatkov do regresij- ske enaˇcbe. Metodo cosinor lahko uporabimo za razliˇcno ˇstevilo kompo- nent in tako testiramo, katero ˇstevilo komponent podatkom najbolj ustreza.

Drugi del raˇcunske metode pa predstavlja reˇsevanje regresijske enaˇcbe. Ta problem reˇsimo z uporabo regresijskih raˇcunskih modelov. Gre za analizo ˇstevnih podatkov, zato uporabimo raˇcunske modele, ki so primerni za tovr- stne podatke. V raˇcunski metodi smo implementirali pet modelov, in sicer:

Poissonov model, generaliziran Poissonov model, Poissonov model z infla- cijo niˇcel, negativen binomski model in negativen binomski model z inflacijo niˇcel. Vzpostavljena metodologija za analizo cirkadianih ˇstevnih podatkov vkljuˇcuje tudi ovrednotenje – iskanje najbolj ustreznega modela z optimal- nim ˇstevilom komponent. Optimalno ˇstevilo komponent poiˇsˇcemo s pomoˇcjo F testa, ki ga pogosto uporabimo za primerjavo gnezdenih modelov. Najbolj ustrezen tip raˇcunskega modela pa lahko poiˇsˇcemo z uporabo F testa, oziroma Vuongovega testa. Uporabo specifiˇcnega testa lahko potencialni uporabnik doloˇci sam.

41

Reference

POVEZANI DOKUMENTI

ArcSight ESM (Enterprise Security Management) predstavlja glavno komponento celotne SIEM rešitve. korelacijsko jedro, ki omogoča podjetju, da ima v realnem času

Preostala naˇ cina raˇ cunanja, ki ju omogoˇ ca testni program, cuda in opencl, smo uporabili za merjenje raˇ cunskih zmogljivosti dveh grafiˇ cnih kartic.. Prva je AMD Radeon 5850,

Za uˇ cenje jezikovnega modela smo uporabili n-gramski model, kjer smo uporabili 3-grame, ter modele z ponavljajoˇ cimi nevronskimi mreˇ zami.... Tabela 5.3: Parametri odloˇ

Naslednja operacija segmentacije je iskanje obrisov (angl. contour finding), ki iz črno-bele slike izloči krivulje obrisov področij bele barve (in, če bi tako želeli, tudi

Izdelali smo simulacijski model, ki omogoĉa analizo konvencionalnega sušilnega postopka z vidika izbire ustreznega sušilnega programa, izraĉunavanja ĉasa sušenja,

Za analizo vpliva skupine ocenjevalcev, serije ocenjevanja in postopka pridelave penečih vin na senzorične lastnosti smo uporabili statistični model, v katerega smo vključili fiksne

Na eni strani smo upoštevali dva modela (Ofcom model in FSANZ model), ki temeljita na oceni pridobljeni z upoštevanjem točk za "negativne" parametre (energijska

Iz opredelitve multikulturnega modela, na primer, ni jasno, ali skupni niz vrednot v tem modelu predstavljajo vrednote večinske družbe, ki jih morajo imigranti prevzeti oziroma se