• Rezultati Niso Bili Najdeni

Intuitivno je, da se na postajah, ki so geografsko locirane skupaj ali pa si delijo neko lastnost, to odraˇza tudi na njihovem ritmu izposoj. ˇCe podrobno pogledamo na dnevni vizualizacijo od postaje na Preˇsernovem trgu 4.3 in vizualizacijo postaje pri Kinu ˇSiˇska 4.5, opazimo, da sta si povsem komple-mentarni.

Postaja Kino ˇSiˇska je locirana izven strogega centra, v veˇcernih urah se napolni in v jutranjih urah izprazni. Ljudje se s postaj, ki so okoli centra in so tipiˇcno postavljene okoli gosto naseljenih sosesk, v jutranjih urah odpeljejo v center ter kolo pustijo na postaji v centru, kot je Preˇsernov trg. Zveˇcer si za pot nazaj domov izposodijo kolo v centru in ga vrnejo na postaji, ki je naj-bliˇzja njihovemu domu. Tako bi lahko opisali dnevni ritem sistema BicikeLj.

S tako teorijo lahko sklepamo, da imamo v ljubljanskem sistemu BicikeLj dva tipa postaj. Prvi tip so postaje, locirane v strogem centru, drugi tip pa so postaje okoli centra.

Zaradi odstotkovnega zapisa podobnosti med postajami na lestvici med 0 in 1 je najbolj primerna metrika za ocenjevanje razliˇcnosti MAE 4.1. MAE je angleˇska okrajˇsava za Mean Absolute Error, slovensko absolutna povpreˇcna napaka. Metrika RMSE, angleˇsko Root Mean Square Error, oziroma sloven-sko koren povpreˇcne kvadratne napake, bi zaradi zaradi vrednosti med 0 in 1 vraˇcala izjemno majhne vrednosti, ki jih je teˇzje interpretirati.

Cer primerjamo odstotek zasedenosti dveh postaj na minutnem intervaluˇ z metodo povpreˇcne absolutne napake, dobimo povpreˇcno razliko med po-stajama, podano v odstotkih. Dobljeno vrednost odˇstejemo od 1 4.2 in tako dobimo vrednost, ki odraˇza podobnost med postajama.

M AE = 1 n

n

X

i=1

|yi−yˆi|= 1 n

n

X

i=1

|ei| (4.1)

P odobnost= 1−M AE (4.2)

4.6. ZDRU ˇZEVANJE PODOBNIH POSTAJ 59

V spodnji tabeli 4.4 si lahko ogledamo deset najbolj podobnih postaj.

Povpreˇcna podobnost med vsemi postajami je 0.7095. Opazimo, da so na lestvici veˇcinoma postaje, ki so locirane okoli strogega centra.

Izstopajo pa tudi tri postaje iz nakupovalnega srediˇsˇca BTC. Na prvem mestu sta postaji Citypark in Atlantis, na 6. mestu pa postaji Citypark in BTC dvorana A. Preostala kombinacija med postajo BTC Atlantis in BTC dvorano A pa se ni uvrstila na seznam, saj je na 21. mestu s podobnostjo 0.8143. Glede na to, da imamo med 36 postajami 630 unikatnih parov, jo 21. mesto ˇse vedno uvrˇsˇca med 4 odstotke najbolj podobnih postaj.

postaja A postaja B 1 - MAE

CITYPARK BTC CITY ATLANTIS 0.8457 MIKLOSICEV PARK BAVARSKI DVOR 0.8451 CANKARJEVA UL.-NAMA MIKLOSICEV PARK 0.8363 CANKARJEVA UL.-NAMA BAVARSKI DVOR 0.8321 GRUDNOVO NABREZJE BAVARSKI DVOR 0.8286 CITYPARK BTC CITY DVORANA A 0.8275 GRUDNOVO NABREZJE ILIRSKA ULICA 0.8269

BREG BAVARSKI DVOR 0.8267

BAVARSKI DVOR ILIRSKA ULICA 0.8267 KINO SISKA BARJANSKA C. TRNOVO 0.8231 Tabela 4.4: Lestvica desetih najbolj podobnih postaj.

60 POGLAVJE 4. PRIPRAVA IN VIZUALIZACIJA PODATKOV

Med pregledovanjem postaj sem opazil zanimivo lastnost med postajo BTC dvorana A in BTC Atlantis. Postaja BTC dvorana A je veliko bolj aktivna in ima veliko veˇcjo frekvenco izposoj kot postaja pred Atlantisom.

Vendar kljub temu lahko med njima najdemo oˇcitne podobnosti. Na spodnjih dveh vizualizacijah 4.6 in 4.7 lahko vidimo vzajemno polnitev postaj, ki se zaˇcne okoli 15:00 ure, ter ob 19:00 moˇcno istoˇcasno zapolnitev za pribliˇzno 20 odstotkov.

Slika 4.6: Vizualizacija ponedeljka, 23. 5. 2016, na postaji BTC dvorana A.

Slika 4.7: Vizualizacija pondedeljka, 23. 5. 2016, na postaji BTC Atlantis.

4.6. ZDRU ˇZEVANJE PODOBNIH POSTAJ 61

Tabela 4.5 prikazuje med seboj najmanj podobne si postaje. Najbolj izra-zite razlike najdemo med postajami iz strogega centra in dvema postajama, ki sta za Beˇzigradom.

Postaja na kriˇziˇsˇcu Vojkove in Boˇziˇceve ceste je v bliˇzini ˇsportnega objekta Stoˇzice, kjer potekajo ˇsportni dogodki in tudi koncerti, predstave ter podobni druˇzabni dogodki. Predvidevamo lahko, da je aktivnost postaje moˇcno pove-zana z dogajanjem na ˇsportnem objektu Stoˇzice. Na ˇzalost nimamo podatkov oziroma urnika o tamkajˇsnjih dogodkih, zato te hipoteze nismo mogli preve-riti.

postaja A postaja B 1 - MAE

BAVARSKI DVOR VOJKOVA C.-BOZICEVA C. 0.5367 KONGRESNI TRG VOJKOVA C.-BOZICEVA C. 0.5356 CANKARJEVA UL.-NAMA DUNAJSKA C.-PS MERCATOR 0.5326 CANKARJEVA UL.-NAMA VOJKOVA C.-BOZICEVA C. 0.5277 POGACARJEV TRG-TRZNICA DUNAJSKA C.-PS MERCATOR 0.5236 PRESERNOV TRG VOJKOVA C.-BOZICEVA C. 0.5184 CANKARJEVA UL.-NAMA DUNAJSKA C.-PS MERCATOR 0.5326 CANKARJEVA UL.-NAMA VOJKOVA C.-BOZICEVA C. 0.5277 KONGRESNI TRG DUNAJSKA C.-PS MERCATOR 0.5159 PRESERNOV TRG DUNAJSKA C.-PS MERCATOR 0.4879

Tabela 4.5: Lestvica desetih najmanj podobnih postaj.

Glede na podatke sem se odloˇcil, da postaje razvrstim v tri kategorije:

• Kategorija 1: Postaje v strogem centru oziroma postaje, ki so polne ˇcez dan.

• Kategorija 2: Postaje izven strogega centra, ki so nasprotujoˇce si postajam iz centra, ker pomeni, da so polne ponoˇci.

• Kategorija 3: Postaje znotraj nakupovalnega srediˇsˇca BTC.

62 POGLAVJE 4. PRIPRAVA IN VIZUALIZACIJA PODATKOV

Kategorije postaj sem prikazal na interaktivnem zemljevidu 4.8. Vsak krog simbolizira postajo BicikeLj. Velikost kroga predstavlja popularnost postaje oziroma njeno frekvenco izposoj ter vrnitev na postaji. Za izraˇcun radija sem uporabil formulo 4.3. Seˇstel sem absolutne vrednosti gradienta zasedenosti postaje. Rezultati sem mnoˇzil z multiplikatorjem ”m”, v mojem primeru je bil ”m”nastavljen na 0.33, tako sem kroge pomanjˇsal, da je bila njihova velikost bolj primerna za predstavitev na zemljevidu.

radij =

n

X

i=1

|∆xi|

!

∗m (4.3)

Barva kroga predstavlja kategorijo postaje, kot vidimo, so z oranˇzno barvo predstavljene postaje v centru, z modro okoliˇske postaje in z zeleno postaje v nakupovalnem srediˇsˇcu BTC.

Slika 4.8: Zaslonski posnetek interaktivnega zemljevida, ki prikazuje katego-rije postaj in njihovo popularnost pri strankah.

4.6. ZDRU ˇZEVANJE PODOBNIH POSTAJ 63

Ce uporabnik interaktivnega zemljevida klikne na krog oziroma marker,ˇ ki reprezentatira postajo, se mu odpre okno, v katerem lahko vidi graf in naslov postaje. Graf prikazuje zasedenost postaje skozi ˇcas. Kot vidimo na sliki 4.9, nam za postajo, ki je na Slovenski cesti 55c, manjkajo podatki na zaˇcetku meseca maja.

Zavedam se, da graf ni najbolj reprezentativen, vendar sem ga vseeno vkljuˇcil kot dodatno funkcionalnost zemljevida.

Slika 4.9: Graf markerja.

64 POGLAVJE 4. PRIPRAVA IN VIZUALIZACIJA PODATKOV

Poglavje 5

Napovedovanje razpoloˇ zljivosti postaj

Za klasifikacijsko napovedovanje zasedenosti postaje BicikeLj sem uporabljal implementacijo odloˇcitvenega drevesa in metodo nakljuˇcnih dreves, imple-mentiranih v Sparku.

Za regresijsko napovedovanje sem uporabljal algoritem k-NN, vendar ta v Sparku ni podprt, zato sem uporabil implementacijo iz knjiˇznice Sklearn.

5.1 Odloˇ citveno drevo

Odloˇcitveno drevo [1] je klasifikacijska metoda, ki uporablja podatke za gra-dnjo tako imenovanega odloˇcitvenega drevesa. Algoritem glede na oceno in-formativnosti posameznih atributov izbira atribute in ustrezne podmnoˇzice njihovih vrednosti za gradnjo odloˇcitvenih pravil. Dobljene pogoje najpogo-steje dodajamo k pogojnemu delu pravila. Sklepni del pravila vsebuje enega ali veˇc razredov, ki jim pripadajo ustrezni uˇcni primeri. Klasifikacija novega primera poteka tako, da se sproˇzi ustrezno pravilo.

65

66 POGLAVJE 5. NAPOVEDOVANJE RAZPOLO ˇZLJIVOSTI POSTAJ