• Rezultati Niso Bili Najdeni

Okolje RStudio je v osnovni različici brezplačno okolje za delo z jezikom R. Vsebuje uka-zno vrstico oz. konzolo, urejevalnik, ki označuje sintakso, katera podpira tudi direktno izvedbo kode, kot tudi orodja za risanje grafov, shranjevanje zgodovine, razhroščevanje (angl. debugging). Poleg tega pa ekipa RStudia podpira razvoj knjižnic, paketov in projektov v R3.

Ko namestimo okolje RStudio, se nam ob zagonu programa pokaže platno z nekaj odprtimi okni. Ta okna si lahko po želji odpiramo, prilagajamo in tudi zapiramo.

Nekaj od teh oken je opisanih v nadaljevanju.

• Console

Okno Console je okno, ki je namenjeno temu (kot v večini okolij za programi-ranje), da nam program sporoča, kaj se je izvedlo, javi morebitno napako ali pa ga lahko uporabimo preprosto za pisanje ukazov, če le ne gre za preveč dolge in zahtevne stvari. Za take primere pa je bolj primerno pisanje skript.

• Terminal

Samo terminalno okno nam lahko pride v pomoč, če smo bolj vešči iskanja stvari na našem disku na tak način, sicer pa se da vse narediti preko grafičnega vme-snika, imenovanega Files. Seveda terminalno okno kot tako ni namenjeno temu, opisan je zgolj eden od primerov uporabe.

3https://www.rstudio.com/products/rpackages/

• Files

Okno Files nam je v pomoč pri grafični upodobitvi iskanja naših datotek, skript, slik, grafov in drugih stvari na našem disku oz. diskih. Med drugim vidimo ime datoteke oz. mape, datum njenega nastanka in velikost.

• Plots

Okno Plots je okno, kjer se ob grafičnem prikazovanju podatkov izrišejo ustrezni grafi oz. druge grafične upodobitve. Te lahko s klikom na gumb Export, ki se nahaja v oknu Plots, izvozimo in uporabimo kot sliko ali dokument oblike pdf, kar je koristno, saj želimo po navadi grafe komentirati in pojasniti v zunanjem dokumentu.

• Environment

Okno Environment pa je tisto okno, ki nam prikazuje, kaj imamo v trenutnem delovnem okolju implementirano oz. shranjeno. To je koristno iz preprostega razloga, da lahko vidimo, kaj smo že sporočili samemu programu in ali je to shranil. Kar imamo shranjeno, lahko prenesemo tudi na drug računalnik oz.

drugo napravo. Poleg tega pa omogoča nemoteno delo tudi, če program RStudio zapremo, saj nam ponudi možnost, da trenutno delovno okolje shrani in lahko, kot že omenjeno, nemoteno nadaljujemo z delom ob ponovnem zagonu programa.

• History

Okno History nam omogoča, da vidimo celoten potek našega dela. Koristno je predvsem zato, ker lahko hitro vidimo spremembe, ki so se dogajale takrat, ko mi nismo upravljali s tem programom.

Potrebno pa je opzoriti, da glede na uporabikovo naravo dela obstaja mnogo različ-nih oken, ki jih lahko uporabljamo. Zgornja okna temeljijo na delu, ki sem ga opravljal sam, nekatera pa so tudi taka, ki naj bi bila univerzalno uporabna tudi za druge upo-rabnike na področju drugačne tematike.

Za pisanje skript odpremo posebno okno, ki ga najdemo pod zavihtkom File ->

New File. Skripte so namenjenu pisanju daljših programov oz. zaporedjem ukazov, ki jih želimo shraniti in ponovno uporabiti. Res je, da se da to narediti tudi v samem oknu Console, a gre v tem primeru za veliko bolj enostavno izpeljavo. Tako kot pri ostalih programskih okoljih se tu odpre prazna skripta, v katero nato pišemo ukaze.

Ko pa želimo pognati skripto, preprosto označimo del skripte, za katero želimo, da se izvede in se bo izvedel točno ta izbrani del. Torej ne bo pognal celotne napisane skripte, kar je lahko pozitivno, da ne delamo vseh stvari znova in znova, pač pa nam omogoča zagon samo določenega dela skripte.

Del II

Empirični del

Poglavje 5

Opis podatkov za napovedovanje izidov tekem lige NBA

Sezona v ligi NBA je sestavljena iz dveh delov. Začne se z rednim delom, ki traja približno sedem mesecev, od oktobra do sredine aprila naslednjega leta. Drugi del, v katerega se ne uvrstijo vse ekipe, pa je končnica lige NBA in se začne takoj po končanem rednem delu sezone. V končnico se uvrsti najboljših osem ekip iz zahodne in osem najboljših ekip iz vzhodne konference. V rednem delu vsaka izmed 30 ekip odigra 82 tekem. Več o ligi NBA in posamezni sezoni lige NBA je zapisano v prvem delu magistrskega dela, v poglavju 3.3.

Ker bi za beleženje podatkov v posamezni sezoni potreboval veliko časa in ker to ni namen magistrskega dela sem preiskal različne vire, ki redno in zanesljivo beležijo podatke za posamezne tekme in ekipe. Po pregledovanju veliko različnih virov sem se odločil za enega samega1 s podatki, ki so najbolj ustrezali temi magistrskega dela, poleg tega pa podatki niso zahtevali pretiranega ukvarjanja s prepisovanjem, temveč sem jih lahko le kopiral in nato urejal sam po svojih željah.

Ta spletna stran nudi več različnih vrst podatkov, od katerih sta za moje delo ustre-zna in potrebna samo dva tipa podatkov. Prvi tip podatkov so podatki o posamezni ekipi, torej vsi statistični elementi so beleženi za vsako ekipo posebej, drugi tip pa so podatki o posamezni odigrani tekmi za vsako odigrano tekmo v sezoni lige NBA.

Iz spletne strani sem zbiral in iskal podatke za napovedovanje tekem v zadnjih dveh odigranih sezonah, 2016/17 in 2017/18. Podatke za posamezne ekipe pa sem zbral za preteklih pet sezon, torej za sezone 2017/18, 2016/17, 2015/16, 2014/15 in 2013/14.

Podatki na spletni strani so prosto dostopni.

Pri napovedovanju rezultatov tekem lige NBA sem se osredotočil samo na tekme in rezultate v rednem delu sezone, končnice v magistrskem delu nisem upošteval. Razlogov za to odločitev je več, glavni pa je ta, da sem želel ustvariti napovedne modele za vse ekipe v ligi NBA in ne samo tiste, ki se uvrstijo v končnico lige NBA. Poleg tega pa gre v končnici za drugačen razpored in potek tekem, kot je to v rednem delu posamezne sezone v ligi NBA.

1https://www.basketball-reference.com/

5.1 Zajem in urejanje podatkov

S pomočjo vira, ki je naveden v poglavju 5, sem sestavil dve različni tabeli iz podatkov, ki sem jih potreboval za svoje delo. Iz spletne strani sem s pomočjo danih podatkov dobil dva tipa tabel. Prva tabela je vsebovala statistične podatke za vsako ekipo posebej, druga tabela pa je vsebovala vse odigrane tekme v sezonah 2016/17 in 2017/18.

Posamezna imena stolpcev so podrobneje pojasnjena v prilogi magistrskega dela.

5.1.1 Prvi tip tabele

Prva tabela je sestavljena iz 60 vrstic in 485 stolpcev. Vsaka ekipa zaseda dve vrstici.

Prva izmed teh dveh vrstic od vsake ekipe vsebuje podakte o sezonah 2015/16, 2014/15 in 2013/14, druga izmed teh dveh vrstic pa podatke o sezonah 2016/17, 2015/16 in sezoni 2014/15.

Vsak stolpec ustreza povprečnemu dosežku v enem košarkarskem statističnem ele-mentu v opazovani sezoni. Stolpci se med seboj razlikujejo po tipu podatkov, ki jih vsebujejo. Vsak stolpec (razen miscellaneous) vsebuje podatke o ekipi (T) ter o nji-hovih nasprotnikih (O).

Stolpci, ki imajo na začetku imena basic.game, so statistični elementi, ki se nana-šajo na osnovne statistične elemente, kot so dosežene točke, doseženi skoki . . . Stolpci, ki imajo na začetku kratico basic.per100, so stolpci, ki vsebujejo preračunane po-datke glede na to, če bi ekipa imela 100 napadov2 na eni tekmi. Tretja vrsta stolpcev je označena z besedo miscellaneous, vsebuje pa podatke, ki se ne dotikajo direktno same igre ekipe, ampak so to podatki o starosti igralcev, imenu dvorane . . . Zadnji stolpci pa so tisti, ki vsebujejoshooting.game in se nanašajo na to, kako je ekipa oz.

nasprotnik imel razporejene mete na tekmi – narejeni so določeni pasovi na igrišču in beležijo mete iz teh območij3.

5.1.2 Drugi tip tabele

V drugem tipu tabele se nahajajo vse odigrane tekme v sezonah 2016/17 in 2017/18.

Tabela ima 4920 vrstic in 49 stolpcev. Po abecednem vrstnem redu si sledijo ekipe in v vsaki vrstici se nahaja ena odigrana tekma. V stolpcih se nahajajo posamezni statistični elementi opazovane tekme.

V prvih sedmih stolpcih so zabeleženi osnovni podatki o tekmi, torej, kateri ekipi sta igrali med seboj, v kateri sezoni, datum tekme . . . Nadalje so v stolpcih podatki za ekipo, ki je zapisana v stolpcu team, ter vsi statistični elementi, ki so jih dosegli na tej opazovani tekmi. Nadaljujejo se stolpci nasprotne ekipe, kjer so vsebovani vsi statistični elementi, katere je dosegla nasprotna ekipa.

2Napad v košarki se začne, ko ekipa dobi žogo, in se konča, ko ekipa vrže na koš, izgubi žogo ali se izteče ura za napad (24 sekund).

3Podrobna delitev teh območij je v angleščini opisana na spletni strani https://www.basketball-reference.com/about/glossary.html, v slovenščini pa v poglavju B magistrskega dela.

Zadnjih osem stolpcev pa je namenjenih za t. i. statistiko ”štirih faktorjev” (angl.

Four Factors), med katere sodijo učinkovitost metov iz igre v odstotkih, odstotek sko-kov v napadu, delež izgubljenih žog in delež prostih metov (podroben opis v poglavju 3.6.2). Ponovno so prvi štirje stolpci namenjeni za opazovano ekipo in naslednji štirje za nasprotno ekipo.

5.2 Priprava podatkov za napovedovanje izidov