• Rezultati Niso Bili Najdeni

FAKULTETA ZA MATEMATIKO IN FIZIKO Finanˇ cna matematika – 1. stopnja

N/A
N/A
Protected

Academic year: 2022

Share "FAKULTETA ZA MATEMATIKO IN FIZIKO Finanˇ cna matematika – 1. stopnja"

Copied!
29
0
0

Celotno besedilo

(1)

UNIVERZA V LJUBLJANI

FAKULTETA ZA MATEMATIKO IN FIZIKO Finanˇ cna matematika – 1. stopnja

Maj Gaberˇsˇ cek

Metode podatkovne analitike za nadzor kakovosti ˇ studijev

Delo diplomskega seminarja

Mentor: doc. dr. Alen Orbani´ c

Ljubljana, 2021

(2)

Kazalo

1. Uvod 5

1.1. Postopek dela 5

1.2. Varstvo osebnih podatkov 6

1.3. Agencija NAKVIS 6

2. Struktura vhodnih podatkov 6

2.1. Tabela o vpisih 7

2.2. Tabela o opravljanju izpitov 7

2.3. Tabela o dokonˇcanju ˇstudija 7

2.4. Zeljena konˇˇ cna struktura podatkov 7

3. Anonimizacija 7

4. Uvoz podatkov, normalizacija, tabela dogodkov 9

4.1. Tabela Dogodki 10

5. Uvod v analize 11

6. Analiza ocen ˇstudentov po predmetih 11

6.1. Opis analize 11

6.2. Postopek obdelave podatkov 11

6.3. Uporabnost 13

6.4. Vpliv anonimizacije 14

6.5. Kazalniki 14

7. Analize ocen ˇstudentov skozi ˇcas ˇstudiranja 14

7.1. Opis analize 14

7.2. Postopek obdelave podatkov 15

7.3. Uporabna vrednost analize 15

7.4. Vpliv anonimizacije 16

7.5. Numeriˇcni kazalniki 17

8. Analiza pretoˇcnosti ˇstudentov skozi predmete 17

8.1. Opis analize 18

8.2. Priprava podatkov 18

8.3. Uporabnost analize 19

8.4. Vpliv anonimizacije 20

8.5. Numeriˇcni kazalci 20

9. Analiza pretoˇcnosti ˇstudentov skozi ˇstudije 20

9.1. Opis analize 20

9.2. Priprava podatkov 20

9.3. Razlaga diagrama pretoˇcnosti 21

9.4. Razlaga sonˇcnega diagrama 21

9.5. Uporabnost analize 22

9.6. Vpliv anonimizacije 23

9.7. Kazalniki 23

10. Analiza prepisov ˇstudentov med programi 24

10.1. Opis analize 25

10.2. Priprava podatkov 25

10.3. Razlaga diagrama strun 25

10.4. Uporabnost analize 27

10.5. Vpliv anonimizacije 27

10.6. Kazalniki 27

11. Cilji in zakljuˇcek 28

(3)

Slovar strokovnih izrazov 28

Literatura 29

(4)

Metode podatkovne analitike za nadzor kakovosti ˇstudijev

Povzetek

Metode podatkovne analitike pri nadzoru kakovosti ˇstudija si lahko pogledamo skozi analize ocen (po predmetih, po ˇcasu), analize pretoˇcnosti (skozi predmete ter skozi letnike) in analize prepisov ˇstudentov med programi.

Skupaj te analize tvorijo celosten in kompleksen pregled skoraj vseh aspektov ˇstudija. S pomoˇcjo grafov in vizualizacij, diagramov in tabel pri vsaki analizi na hiter in preprost naˇcin lahko ugotavljamo dobre in slabe lastnosti poteka ˇstudija, prednosti in slabosti. V oko takoj padejo posebnosti, ki morda samo iz golih tabel podatkov ne izstopajo.

Celotna metodologija podatkovne analize, opisana v tej diplomski nalogi, lahko olajˇsa delo in prihrani precej ˇcasa tistim, ki se s takimi pregledi ˇstudijev tudi profe- sionalno ukvarjajo.

Vse analize in metode, ki nastopajo v tej diplomski nalogi, sem tudi sprogramiral v programskem jezikuR in program hranil na privatnem repozitoriju. ˇCe v program vstavimo dejanske podatke o nekem ˇstudiju, vrne grafe, diagrame ter tabele, opisane v tej nalogi.

Data analysis methods for study program quality control

Abstract

Data analysis in quality control of university level studies could be viewed through the analysis of grades (by course, by time), flow analysis (through subjects and through years) and analysis of student transfers between programs.

Together, these analyses form a comprehensive and complex overview of almost all aspects of the studies. Graphs, visualizations, diagrams and tables help us to identify the advantages and disadvantages of each program or course. Features that may not be identified from the raw data tables immediately stand out.

The entire methodology of data analysis described in this thesis can facilitate the work of and save a lot of time for those who are professionally engaged in such study program reviews. All the analyses and methods that appear in this diploma thesis were also implemented in theR programming language and the whole code is stored in a private repository. If we insert actual data about a study program into implemented procedures, they return graphs, diagrams, and tables described in this thesis.

Math. Subj. Class. (2010): 62-07, 97R70, 97R50

Kljuˇcne besede: evalvacija ˇstudijev, analiza ˇstudijev, podatkovna analitika Keywords: evaluation of studies, analysis of studies, data analysis

(5)

1. Uvod

Beseda ˇstudij ima veˇc pomenov. Pravzaprav si ˇstudij vsak lahko predstavlja po svoje. Za nekatere ˇstudij pomeni obveznost, izpiti, ki jih je potrebno dokonˇcati do nekega roka. Za nekoga drugega ˇstudij pomeni pripravo na odraslo ˇzivljenje ali usposabljanje za poklic. SSKJ pa ˇstudij opredeli kot ˇsolanje zlasti na viˇsji ali visoki ˇsoli.

Kakorkoli si ˇze vlogo ˇstudija razlagamo, se moramo strinjati, da dober in kvaliteten visokoˇsolski ˇstudij svojim ˇstudentom omogoˇca strokovno in znanstveno podlago.

Dobro zastavljen ˇstudij mora hkrati poskrbeti za ˇstudentovo teoretiˇcno in praktiˇcno usposobljenost na svojem podroˇcju.

Pomemben del vsakega ˇstudija pa je tudi uravnoteˇzenost. Predmeti morajo biti raznoliki, primerno teˇzki in ponujati osnovni, temeljni nivo znanja in viˇsji nivo znanja za tiste, ki si ˇzelijo stopnico viˇsje. Ocene naj bi bile raznolike in naj bi odraˇzale dejansko znanje.

Prav uravnoteˇzenost naj bi bila glavna tematika in problematika te diplomske naloge. S korektno in dosledno analizo je cilj iz nabora podatkov o opravljanju obveznosti ˇstudentov na programih fakultete ustvariti nepristransko sliko o dobrih in slabih lastnostih tega programa. Izpostaviti je treba prelahke oziroma preteˇzke predmete, ugotoviti, kje so ocene prenizke in kje previsoke. Dobiti hoˇcemo neko celostno sliko o kakovosti ˇstudija in njegovih prednostih ter pomanjkljivostih.

1.1. Postopek dela. Programski jezik, v katerem so obdelani podatki in narisani grafi ter diagrami, je programski jezik R. Za programsko okolje je bila uporabljena programska oprema RStudio.

R je jezik in okolje za statistiˇcno raˇcunalniˇstvo in grafiko. Ponuja ˇsiroko paleto statistiˇcnih (linearno in nelinearno modeliranje, klasiˇcni statistiˇcni testi, analiza ˇ

casovnih vrst, razvrˇsˇcanje, zdruˇzevanje v skupine) in grafiˇcnih tehnik ter vsebuje veliko razˇsiritev, ki dodatno olajˇsajo delo.

RStudioje integrirano razvojno okolje za R. Vkljuˇcuje konzolo, urejevalnik sinta- kse, ki podpira neposredno izvajanje kode, pa tudi orodja za risanje grafov, odpra- vljanje napak in upravljanje delovnega prostora.

Shiny je paket v R, ki olajˇsa izdelavo interaktivnih spletnih aplikacij neposredno iz R. Z njim smo si pomagali izdelati tudi nekakˇsne manjˇse spletne aplikacije, ki prikazujejo grafe in vizualizacije za potrebe analiz.

Vhodni podatki, ki so na voljo na zaˇcetku, vsebujejo vse informacije o poteku ˇstudija ˇstudentov: vpise v letnike, pridobivanje ocen, dokonˇcanje ˇstudija z diplomi- ranjem. ˇCeprav naj bi podatki ˇze bili v dokaj pregledni in lepi obliki, pa ob bolj podrobnem pregledu naletimo na veˇc komplikacij. Na primer, laiˇcno poznamo vrste vpisov v letnike kot so prvi vpis, ponavljanje in pavziranje. V vhodnih podatkih pa se pojavi devet razliˇcnih vrst vpisa: prviˇc, prvi vpis v program - v viˇsji letnik na pod- lagi priznanih obveznosti, po merilih za prehode v isti letnik, po merilih za prehode v viˇsji letnik, pavzira, ponovno, vpis za zakljuˇcek, s podaljˇsanim statusom ˇstudenta in drugo. Takˇsne posebnosti je treba v nadaljevanju pregledati in se odloˇciti na kakˇsen naˇcin vpise grupirati, filtrirati ali zavreˇci, da vse bistvene informacije ostanejo, po- datke pa pribliˇzamo javnosti. Podrobnejˇsi opis podatkov vsebuje razdelek Struktura vhodnih podatkov.

Vhodni podatki so nato uvoˇzeni iz zunanjih tabel v formatu CSV (angl. comma- separated values) v lokalne strukture programaR, imenovanedata.frame, s katerimi

(6)

je najlaˇzje operirati v tem programskem jeziku. Podatke je potrebno ˇse normalizi- rati in pospraviti v urejeno tabelo. Podrobneje so postopki uvaˇzanja podatkov in urejanja tabel opisani v razdelku Uvoz podatkov, normalizacija, tabela dogodkov.

Urejeni podatki so tako pripravljeni za analizo. V tej fazi ˇzelimo s pomoˇcjo razliˇcnih grafov in tabel prikazati kljuˇcne lastnosti ˇstudija, iz njih hoˇcemo ˇcimbolj jasno in nazorno videti izstopajoˇce lastnosti. Opise analiz in komentarje o tem, kako iz doloˇcenih grafov ugotavljamo doloˇcene problematike ˇstudija, vsebuje poglavje Analize in vizualizacija.

Zadnje poglavje, Cilji in zakljuˇcek, govori o doseˇzenih ciljih te diplomske naloge, podane pa so tudi nekatere ideje o nadaljnih, bolj podrobnih analizah.

1.2. Varstvo osebnih podatkov. Listina EU o temeljnih pravicah drˇzavljanom Evropske unije zagotavlja pravico do varstva osebnih podatkov. Vhodni podatki, ki bi jih uporabil v tem diplomskem delu, so resniˇcni podatki o ˇstudiranju pravih ˇstudentov. Zavedam se, da je razkritje osebnih podatkov resen prekrˇsek in nedo- pusten poseg v zasebnost posameznika. Zato pravih podatkov sam nisem nikoli videl. Analize in grafi temeljijo na anonimiziranih podatkih. Anonimizacijo sem zastavil tako, da ˇcimbolj zabriˇse podatke o nekem posamezniku, hkrati pa ohrani strukturo podatkov takˇsno, da ˇcimmanj izkrivi in pokvari rezultate analiz (opis po- stopka anonimizacije je v poglavju Anonimizacija). Program anonimizacije sem poslal mentorju, ki jo je izvedel na pravih podatkih, ter mi vrnil anonimizirane tabele, na katere sem se nato opiral pri analizah.

1.3. Agencija NAKVIS. V Sloveniji za kakovost ˇstudijev skrbi agencija NAKVIS (Nacionalna agencija Republike Slovenije za kakovost v visokem ˇsolstvu). Njihovo poslanstvo je skrb za razvoj in delovanje sistema zagotavljanja kakovosti v sloven- skem visokem ˇsolstvu. Delujejo vsebinsko in formalno odgovorno ter svetovalno do vseh deleˇznikov in udeleˇzencev v terciarnem izobraˇzevanju v skladu z evropskimi in svetovnimi smermi razvoja.

Agencija s sistemom razvoja zagotavljanja kakovosti skrbi, da bo visoko ˇsolstvo v Sloveniji izobraˇzevalno in raziskovalno kakovostno, mednarodno prepoznavno, kon- kurenˇcno in enakovredno vkljuˇceno v svetovni visokoˇsolski prostor.

Cilji in vizija agencije torej sovpadajo z vsebino te diplomske naloge. Ena od dolˇznosti agencije je namreˇc tudi evalvacija ˇstudijev in opozarjanje visokoˇsolskih zavodov k problematikam na njihovih programih. Glede na to da so vrednoste agencija strokovnost, transparentnost in razvoj, se agencija zavzema za strokovni in javni pregled visokoˇsolskih zavodov.

Vseeno pa na spletni strani ali v poroˇcilih nisem naˇsel enotnega naˇcina evalvacije ˇstudijev in enoliˇcnih, objektivnih kazalnikov napredka ali izboljˇsevanja ˇstudijskih programov.

Ta naloga je poskus doloˇcitve ˇcimbolj nepristranskega in objektivnega sistema analiz in kazalnikov, ki so dovolj preprosti, da brez veˇcjega poglabljanja v podatke pokaˇzejo realno sliko o kakovosti ˇstudijev, hkrati pa dovolj podrobni, da ne izpuˇsˇcajo bistvenih informacij.

2. Struktura vhodnih podatkov

Vhodni podatki vsebujo tri velike tabele: vpisi.xlsx, izpiti.xlsx in diplome.xlsx.

Podatki so takˇsne oblike, da ˇcimbolj posnemajo tabele, kakrˇsne se da pridobiti iz sistema VIS. Tako ima program tudi uporabno vrednost, ˇce bi kdo kdaj ˇzelel

(7)

narediti analizo na dejanskih podatkih. Vhodni podatki so sicer vsebovali ˇse eno tabelo, tabelo srednjeˇsolskih ˇstudijev. Ta je vsebovala vse podatke o srednjeˇsolskih ˇstudijih, a smo jo kasneje zavrgli, saj je nobena analiza ne uporablja.

2.1. Tabela o vpisih. Tabela o vpisih (vpisi.xlsx), kot ˇze njeno ime namiguje, vsebuje podatke o vpisih ˇstudentov v letnike. Med podatki so tako prvi vpisi (v nek letnik), kot tudi ponovni vpisi ter pavziranja. Vsaka vrstica te tabele vsebuje po en vpis, v stolpcih pa vse podatke o tem vpisu: datum zaˇcetka vpisa, datum zakljuˇcka vpisa, ime in priimek ˇstudenta, njegov spol, program vpisa, letnik vpisa, naˇcin vpisa (prvi vpis v letnik, ponavljanje, pavziranje), kraj izvajanja programa in vpisno ˇstevilko ˇstudenta.

2.2. Tabela o opravljanju izpitov. Ta tabela (izpiti.xlsx) vsebuje vse podatke o opravljenih izpitih: krajˇsi in daljˇsi naziv opravljenega predmeta in njegovo kratico, letnik izvajanja predmeta, ˇstevilo kreditnih toˇck predmeta, oceno, oceno vaj, datum vpisa ocene, vpisno ˇstevilko ˇstudenta in njegov spol. V vsaki vrstici je torej eno dokonˇcanje predmeta in se ujema z vpisom ocene v sistem ViS.

2.3. Tabela o dokonˇcanju ˇstudija. Tabela diplome.xlsx nosi informacije o vsa- kem dokonˇcanju ˇstudija (opravljenem diplomskem delu). Vsaka vrstica vsebuje in- formacijo o enem diplomiranju, stolpci pa so: spol in vpisna ˇstevilka ˇstudenta, tip diplome (program, ki ga je ˇstudent dokonˇcal), datum opravljene diplome, celotno skupno trajanje ˇstudija in ocena diplome.

2.4. Zeljena konˇˇ cna struktura podatkov. Te tri tabele skupaj vsebujejo vse potrebne informacije o poteku ˇstudija vsakega posameznika, vendar bi bila analiza na vsaki posebej precej omejena. Zato ˇzelimo vse te tabele zdruˇziti v eno samo, ki jo bomo imenovali tabela dogodkov in bo vsebovala vse pomembnejˇse informacije iz zgornjih tabel. Delo z njo bo preprostejˇse in hitrejˇse.

3. Anonimizacija

Podatki, ki so v tabelah, opisanih v poglavju Struktura vhodnih podatkov, razkri- vajo osebne informacije. Po Sploˇsni uredbi o varstvu podatkov Evropske unije, ki velja od leta 2016, je javno objavljanje osebnih podatkov in informacij (med katere spadajo tudi vsi podatki o ˇsolanju vsakega ˇstudenta) prepovedano. Zato je bilo potrebno vse zgornje tabele pred obdelavo in analizo anonimizirati, da so se vsi po- datki, ki bi utegnili zgornjo uredbo krˇsiti, zamaskirali. Treba jih je bilo spremeniti do takˇsne mere, da se nihˇce od ˇstudentov, ki je opisan v kakˇsni izmed zaˇcetnih tabel, ne bi mogel v novih anonimiziranih podatkih prepoznati.

Hkrati pa je bilo potrebno tudi nekoliko paziti, da se ni celotna slika podatkov preveˇc popaˇcila. ˇCeprav rezultati analiz niso bistvo te naloge, pa smo si vseeno ˇ

zeleli da se nekaj strukture ohrani. Tako primeri vizualizacij in interpretacij analiz izgledajo vsaj podobni tistim, ki bi jih dobili, ˇce bi analizirali resniˇcne podatke.

Potrebno je bilo torej spremeniti tako osebne podatke ˇstudentov, kot tudi podatke o ˇsolanju (sicer bi se marsikdo v anonimiziranih podatkih lahko naˇsel glede na leto vpisa ali pa vrstnega reda in viˇsin pridobljenih ocen).

Anonimizacije in postopki so opisani spodaj.

(1) Anonimizacija ocen: Ocene se spremenijo tako, da jih nakljuˇcno poveˇcamo za ena, poveˇcamo za dva, pomanjˇsamo za ena, zmanjˇsamo za dva, ali pa jih pustimo enake (vsaka moˇznost ima enako, 20% verjetnost). Pri tem seveda

(8)

upoˇstevamo, da ocena ne sme biti veˇcja od deset ali manjˇsa od ˇsest. Na primer, oceno devet z verjetnostjo ena ˇcetrtina poveˇcamo za ena, pustimo enako, pomanjˇsamo za ena ali pomanjˇsamo za dva. Ocene vaj so spremenjene na podoben naˇcin, le da s poloviˇcno verjetnostjo ostanejo takˇsne kot so ori- ginalne, s 25-odstotno verjetnostjo pa jih poveˇcamo za ena ali pomanjˇsamo za ena. Pri ocenah vaj smo izbrali malo drugaˇcno anonimizacijo kot pri ocenah, da ˇse dodatno zabriˇsemo povezavo med oceno in oceno vaj pri vsa- kem ˇstudentu. Takˇsen naˇcin anonimizacije dobro zakrije originalne ocene in hkrati pribliˇzno ohrani relacije med povpreˇcji predmetov (predmeti ki imajo originalno viˇsje ocene od drugih imajo tudi po anonimizaciji viˇsje ocene od drugih). Se pa izgubi odklon ocen od povpreˇcja, saj po anonimizaciji dobimo veˇc srednjih ocen (sedem, osem in devet), manj pa zelo dobrih oziroma zelo slabih (ˇsest in deset). Efekt spremembe porazdelitve ocen prikazujeta grafa na Sliki 1.

Slika 1. Prikaz spremembe porazdelitve ocen, ˇce anonimizacijo iz- vedemo na enakomerno porazdeljenih ocenah

(2) Anonimizacija osebnih podatkov ˇstudentov: Z 20% verjetnostjo se spremeni tudi spol ˇstudenta. Tako se struktura ˇstudentov glede spolov ne spremeni. Imena in priimke ˇstudentov lahko zanemarimo, saj niso uporabna ali bistvena za nobeno analizo. Ti podatki se med anonimizacijo torej kar iz- gubijo. Spremeniti je bilo treba tudi vpisno ˇstevilko, saj izdaja datum rojstva in je tudi sama po sebi neke vrste osebni podatek, ki se ga ne sme razkriti.

Nove vpisne ˇstevilke so zgenerirane s funkcijo, ki je ˇze vgrajena v programR, UUIDgenerate(), ki nakljuˇcno generira 32-mestno kombinacijo ˇstevk in ˇcrk.

Vpisne ˇstevilke so tako kot ime in priimek za analizo nepomembne, rabimo jih samo za to, da je dogodke mogoˇce zdruˇzevati glede na ˇstudenta, kar pa je za ˇstevilne analize kljuˇcnega pomena.

(9)

(3) Zamik datumov: Doloˇciti moramo moˇzno minimalno in maksimalno leto podatkov, ki bo sluˇzilo za to, da se podatki ne bodo zamaknili pred ali za obdobje, ki ga ti leti oklepata. S tem je doseˇzeno zagotovilo, da se ohrani gostota podatkov in da se podatki o nekem ˇstudiju ne zamaknejo v obdo- bje, ko ˇstudij sploh ˇse ni obstajal. Nato vzamemo celotno zgodovino nekega ˇstudenta (vse njegove podatke). To zgodovino bomo v anonimiziranih podat- kih uporabili enkrat, dvakrat, trikrat ali pa jo zavrˇzemo (vsaka ta moˇznost ima verjetnost ene ˇcetrtine). Nato na vsaki kopijo izvedemo vse druge ano- nimizacije. Zatem funkcija celoten ˇstudij vsake kopije zamakne v nakljuˇcno leto iz dopustnega obdobja. Vsi datumi se zaokroˇzijo na mesece, da se kdo ne bi mogel prepoznati po natanˇcnih datumih opravljanja izpitov ali vpisovanja.

Takˇsen zamik je dober primer anonimizacije podatkov v smislu, da se osebni podatki dobro izgubijo. Ima pa tudi kar nekaj slabosti. Kljub temu, da se datum zaˇcetka ˇstudija premakne na nakljuˇcno mesto, pa intervali datumov med dogodki za vsakega posameznika ostajajo enaki. Nekdo, ki je ˇstudij opravljal na neobiˇcajen naˇcin (kar se tiˇce let opravljanja), bi se morda lahko v tako anonimiziranih podatkih naˇsel. Druga slabost je, da se v notranjo- sti intervala dopustnih translacij po anonimizaciji ˇstevilo dogodkov poveˇca, blizu krajiˇsˇc intervala (blizu minimalnega in maksimalnega dopustnega leta) pa se ˇstevilo dogodkov precej zmanjˇsa. ˇSe najveˇcjo pomankljivost takˇsne anonimizacije pa predstavlja dejstvo, da takˇsno nakljuˇcno premikanje in- tervalov vsebinsko pokvari podatke z vidika analize glede na ˇcasovne vrste.

Katerakoli analiza ali vizualizacija, ki gleda spreminjanje neke lastnosti glede na leto oziroma datum, je praktiˇcno neuporabna, saj so podatki nakljuˇcno premeˇsani.

Obstajajo tudi drugaˇcni naˇcini anonimizacije, ki bi bili morda ˇse boljˇsi. Lahko bi naredili veˇc vrst anonimizacije. Vsaka anonimizacija bi razliˇcno zakrila podatke, glede na potrebe analiz. Na primer, anonimizacija za analizo prepisov bi se bolj osredotoˇcila na to, da ne bi pokvarila strukture prepisov, anonimizacija za ocene pa bi pazila, da ne bi pokvarila porazdelitve ocen.

Anonimizacija bi torej lahko bila narejena tako, da bi ohranila veˇc informacij iz originalnih podatkov in bi ˇse bolje zakrila vse osebne podatke. Vseeno pa se z njo ni- smo veˇc ukvarjali. Pomembna lastnost anonimizacije za naˇso nalogo je, da podatke dobro in varno zabriˇse. Ni pa njen cilj iskanje ˇcimboljˇsih postopkov anonimizacij, prilagojenih posameznim analizam. Bolj kot analiza rezultatov, zaradi katerih ano- nimizacijo sploh rabimo, so pomembne metode analize. Za naˇse potrebe je torej pomembno predvsem, da so se osebni podatki ˇstudentov dovolj dobro zabrisali, da jih lahko uporabimo na bistvenem delu te naloge, razvoju in prikazu metod za ana- lizo kakovosti ˇstudija. Z anonimiziranimi podatki si pomagamo samo pri podajanju primerov analiz.

Anonimizirane podatke na koncu ˇse izvozimo v tabele. Te tabele ˇse vedno niso javno dostopne, rabimo jih samo za podajanje primerov interpretacij razliˇcnih analiz.

4. Uvoz podatkov, normalizacija, tabela dogodkov

Podatki so po anonimizaciji pripravljeni za analize, treba jih je samo ˇse uvoziti in spraviti v obliko razpredelnic, s katero je v programskem jeziku R najlaˇzje operirati.

Vse ˇstiri vhodne tabele najprej uvozimo iz tabel oblikeCSVv obliko R razpredelnic.

Uredimo jih tako, da stolpce tabele preimenujemo v bolj logiˇcna imena, na katere

(10)

se bomo pri analizah laˇzje sklicevali. Nekatere podatke spremenimo, pobriˇsemo dolga imena predmetov in programov ter jih pospravimo v slovarje, na tabelah pa operiramo samo ˇse s kraticami. Vsem ˇstevilskim podatkom spremenimo tip na format numeric(ˇstevila), da se bo dalo z njimi tudi raˇcunati. Pri uvozu in urejanju teh tabel si pomagamo s knjiˇznicami (razˇsiritvami za R): readr, dplyr, readxl, tidyr.

Ko so vse tabele ustrezno poˇciˇsˇcene, normalizirane, neuporabni stolpci izbrisani in pripravljene za obdelavo, jih zdruˇzimo v eno samo tabelo, ki jo imenujemoDogodki.

4.1. Tabela Dogodki. Tabela Dogodki vsebuje vse podatke o vsakem dogodku ˇstudentov, ki so kljuˇcni za analize. V tej tabeli so torej podatki o vsaki pridobljeni oceni, diplomi ali vpisu. Tabela ni normalizirana, nekateri stolpci v njej so funkcijsko odvisni od drugih. Tako smo se odloˇcili, saj je delo s takˇsno tabelo bolj priroˇcno.

Prihranimo si namreˇc precej dela, ko podatke obdelujemo, saj jih lahko veˇcinoma filtriramo, ni pa potrebno toliko zdruˇzevanja podatkov iz razliˇcnih tabel, ki bi sicer bile normalizirane.

Stolpci v tabeli Dogodki, ki opisujejo vsak dogodek, ne glede na njegov tip so:

• STUDENT ID: anonimiziran UUID, razliˇcen za vsakega ˇstudenta

• DATUM: datum dogodka (zaokroˇzen na mesece)

• PROGRAM ID: krajˇse ime programa, ki ga obiskuje ˇstudent ( FIN1: uni- verzitetni ˇstudijski program 1. stopnje Finanˇcna matematika, MAT1: uni- verzitetni ˇstudijski program 1. stopnje Matematika, PRA1: visokoˇsolski strokovni ˇstudijski program 1. stopnje Praktiˇcna matematika, MAT2: ma- gistrski ˇstudijski program 2. stopnje Matematika, PED2: enoviti magistr- ski ˇstudijski program 2. stopnje Pedagoˇska matematika, FIN2: magistrski ˇstudijski program 2. stopnje Finanˇcna matematika )

• LETNIK: letnik, ki ga je obiskoval ˇstudent ob dogodku

• NACIN: naˇcin ˇstudija (redni, izredni)

• VRSTA VPISA: naˇcin vpisa v letnik ( 1: prviˇc, 2: drugiˇc, Pav: pavzira, merIsti: po merilih za prehode v isti letnik, merVisji: po merilih za prehode v viˇsji letnik, Pon: ponovno, 1PrizVis: prvi vpis v program - v viˇsji letnik na podlagi priznanih obveznosti, Pod: s podaljˇsanim statusom ˇstudenta, Zak:

vpis za zakljuˇcek )

• TIP: tip dogodka (vpis, ocena, diploma)

Naslednja skupina stolpcev, ki jih imamo v tej tabeli, so informacije o dogodkih, ki so bistveni samo za ocene (kjer je tip dogodka ocena). Ostala dva tipa dogodkov (diploma ali vpis) imata v teh stolpcih vrednost NA.

• PREDMET ID: krajˇsa oznaka za predmet (celotno ime predmeta imamo v drugi tabeli, ki sluˇzi kot slovar)

• LETNIK VPISA PREDMETA: letnik, v katerem je ˇstudent opravljal pred- met

• OCENA: ocena predmeta

• OCENA VAJE: ocena vaj pri predmetu

Stolpca, ki opisujeta tip diplome in program oziroma naziv diplome, sta relevantna samo za dogodke diplomiranja. Tako imata dogodka tipa vpisa ali ocen v tem stolpcu vrednost NA.

• PROGRAM ID DIPLOME: program, na katerem je bila diploma pridobljena

(11)

Ta tabela je temelj in osnova za vsako analizo, opisano v naslednjih poglavjih.

Se enkrat je potrebno poudariti, da nas v tej nalogi primarno ne zanimajo rezultatiˇ posameznih analiz na anonimiziranih podatkih. Izvedena anonimizacija namreˇc po- nekod preveˇc popaˇci podatke. Rezultati so bolj namenjeni kot primer interpretacije, ˇ

ce bi se metode za analizo uporabile na pravih podatkih.

5. Uvod v analize

Sedaj ko imamo pripravljene in zbrane vse pomembne podatke v eni tabeli, se lahko lotimo analiziranja informacij, ki nam jih ti podatki ponujajo. Sproti bodo v tabeli Dogodki nastajali tudi novi izvedeni stolpci za potrebe razliˇcnih analiz.

Pri vsaki analizi najprej pojasnimo, kaj analiza predstavlja in kakˇsnemu namenu sluˇzi. Potem je opisan postopek obdelave podatkov: kako iz tabele Dogodki do- bimo tabelo, s pomoˇcjo katere lahko hitro vidimo pomembne podatke ali nariˇsemo ustrezne vizualizacije. Potem je povsod opisana uporabnost analiz. Razloˇzeno je, ˇ

cemu kateri graf ali histogram sluˇzi in kaj lahko iz njega razberemo. Podani so tudi nekateri primeri grafov, ki so bili generirani na anonimiziranih podatkih. Na teh grafih so nekakˇsni primeri, kako lahko razliˇcne vizualizacije interpretiramo. V podpoglavju vsake analize je nato ˇse opisan uˇcinek anonimizacije za to analizo, torej kako anonimizacija analizo pokvari.

Prednost vizualizacije podatkov (grafi in diagrami) je v tem, da ponujajo celo- tno sliko, iz katere lahko opazimo veliko pomembnih informacij. Vseeno pa grafe in vizualizacije lahko interpretiramo po svoje, pri ˇcemer lahko veˇcjo pomembnost pripiˇsemo informacijam, ki v resnici niso kljuˇcne in obratno. Poleg tega je pregled vseh analiz za vse programe, predmete, smeri in leta zelo dolgotrajen proces. Zato imamo na koncu vsake analize ˇse doloˇcene kazalce (vrednosti), ki so v numeriˇcni obliki in predstavljajo najpomembnejˇse aspekte vsake analize posebej. Ideja je na- mreˇc, da se najprej pogledajo kazalci, za globalen pregled. Tiste informacije, katerih kazalci odstopajo od priˇcakovanih vrednosti ali so izven intervala ˇzeljenih vredno- sti, pa nato ˇse dodatno pregledamo z grafi in tako poskuˇsamo opredeliti teˇzave in ugotoviti razloge zanje.

Potrebno je tudi poudariti, da so vse opisane dopustne ali zaˇzeljene vrednosti kazalnikov, opisane v naslednjih poglavjih, samo predlagane. Do njih smo priˇsli samo s pregledom vrednosti kazalnikov na anonimiziranih tabelah. Do zares dobro zastavljenih dopustnih vrednosti bi morali priti na bolj premiˇsljen in znanstven naˇcin. Verjetno pa bi se pravilne ˇzeljene vrednosti razlikovale ˇze na podlagi narave razliˇcnih programov oziroma predmetov.

6. Analiza ocen ˇstudentov po predmetih

6.1. Opis analize. Analiza ocen ˇstudentov po predmetih se osredotoˇca na poraz- delitev ocen v nekem letniku nekega programa po predmetih. Sestavljena iz dveh delov. En del sestavlja preprost histogram o povpreˇcnih ocenah (Slika 2), ki pove nekaj o tem, pri katerem predmetu so ocene povpreˇcno previsoke in pri katerem prenizke. Drugi del pa sestavljajo grafi, ki predstavljajo celotno porazdelitev ocen za predmete glede na odstotek ˇstudentov pri vsaki oceni (Slika 3). Pri risanju teh grafov si pomagamo s paketom (razˇsiritvijo za program R) ggvis.

6.2. Postopek obdelave podatkov. V tabelo Dogodki dodamo stolpec LETO, ki iz datuma izluˇsˇci leto (za oceno, diplomo ali vpis). Podatke bomo tako laˇzje primerjali in grupirali.

(12)

Slika 2. Histogram povpreˇcnih ocene predmetov prvega letnika Fi- nanˇcne matematike za leto 2010

Slika 3. Graf porazdelitve ocen predmetov prvega letnika Finanˇcne matematike za leto 2010

Podatke filtriramo tako, da ohranimo le ˇse ocene na tistih programih, letih in letnikih ˇstudentov, ki jih ˇzelimo videti. Prav tako doloˇcimo, ali hoˇcemo za ana- lizo videti ocene predmetov ali ocene vaj. Potem jih grupiramo po predmetih in

(13)

preˇstejemo posamezne pojavitve ocen (Slika 4). Iz tega lahko dobimo povpreˇcno oceno (za histogram povpreˇcnih ocen), ali pa izraˇcunamo deleˇz posameznih ocen in tako nariˇsemo graf porazdelitev ocen.

Slika 4. Primer izseka kode v okolju R: funkcija, ki vrne tabelo po- razdelitve ocen

6.3. Uporabnost. Histogram o povpreˇcnih ocenah je predvsem uporaben, ˇce ˇzelimo ugotoviti, pri katerem predmetu so ocene previsoke in pri katerem predmetu so pre- nizke. ˇCe si pogledamo graf na Sliki 2, so glede na podatke ocene oˇcitno prenizke pri predmetu Mikroekonomija, zelo dobre ocene pa povpreˇcno ˇstudenti dobivajo pri predmetu Optimizacijske metode.

Pomanjkljivost te analize je predvsem v tem, da nam ne razkriva dejanske poraz- delitve ocen, temveˇc nosi samo informacijo o povpreˇcni oceni.

Druga vrsta analize ocen ˇstudentov je graf, ki predstavlja deleˇz ˇstudentov, ki so pri predmetih dobili posamezno oceno. Podatki so toˇcke na grafu, krivulje pa toˇcke istega predmeta interpolirajo tako, da se s toˇckami ujemajo v vrednostih, odvodi krivulje pa so v vsaki interpolirani toˇcki enaki niˇc. Krivulje sluˇzijo za boljˇso pre- glednost pri izrisu veˇcih porazdelitev hkrati. S pomoˇcjo takih grafov se odkrivajo predvsem nepravilnosti v porazdelitvah ocen. Od ocen se priˇcakuje, da teˇzijo k temu, da v porazdelitvi posnemajo normalno porazdelitev, torej mora biti najveˇc ocen viˇsine osem, manj mora biti devetic in sedmic, najmanj pa desetk in ˇsestic. ˇCe si pogledamo Sliko 3, je oˇcitno, da normalne porazdelitve ne posnema skoraj noben predmet. ˇSe najbliˇzje so ji predmeti Mikroekonomija, Analiza I (ki imata vseeno preveˇc ˇsestic) in Optimizacijske metode (ki pa imajo preveˇc desetk). ˇSe najbolj ne- navadno porazdelitev ima Analiza II, ki ima obˇcutno premalo osmic, preveˇc devetic in preveˇc ˇsestic. Pri vseh primerih analiz v celotni tej nalogi se sicer opiramo na vizualizacije anonimiziranih podatkov. Vseeno pa se pri interpretaciji obnaˇsamo, kot da so podatki pravi, saj s tem samo podajamo primere, kako si razlagati pojave na grafih.

(14)

Pomanjkljivost te analize je razvidnost podatkov. Ker je vzorec zelo majhen, grafi nimajo pravilnih oblik. Zato se krivulje precej prepletajo med seboj in tako se ˇcistost nekoliko izgubi. Iz takih grafov teˇzko vidimo, ali so ocene v sploˇsnem previsoke oziroma prenizke. Podoben problem predstavlja tudi veliko ˇstevilo predmetov v nekaterih letnikih na nekaterih programih (predvsem v viˇsjih letnikih, kjer nastopijo izbirni predmeti). To lahko prepreˇcimo, da se omejimo samo na predmete, kjer je ˇstevilo ˇstudentov veliko (torej na tiste, ki jih obiskujejo skoraj vsi ˇstudenti).

Oba grafa se torej med seboj dopolnjujeta in ponujata celostno sliko o ocenah za letnike in programe.

6.4. Vpliv anonimizacije. Ker anonimizacija zaradi zamikanja zgodovin zabriˇse gibanje skozi ˇcas, vpliva tudi na vse vrste analiz, ki slonijo na ˇcasovnih vrstah.

Slika 5. Kazalnika ocen ˇstudentov po predmetih za Finanˇcno mate- matiko, 1. letnik, leto 2010

6.5. Kazalniki.

• Povpreˇcna ocena pri predmetu x. Pove nam, pri katerem predmetu so ocene v povpreˇcju previsoke in kje prenizke. Idealna povpreˇcna ocena naj bi bila okoli 8, sprejemljive pa so verjetno tudi vrednosti med 7,5 in 8,5.

• Standardni odklon ocen od povpreˇcja. Standardni odklon izraˇcunamo po formuli: s =

q 1 N−1

PN

i=1(xi −x)2, pri ˇcemer je N ˇstevilo pridobljenih ocen pri predmetu, xi i-ta ocena in xpovpreˇcna ocena pri predmetu. Stan- dardni odklon od povpreˇcja nam ponudi informacijo o tem, koliko so ocene stran od povpreˇcja. Pove nam torej ali so ocene skoncentrirane blizu pov- preˇcne ocene (majhen s) ali so precej stran (veˇcji s). Dopusten standardni odklon bi lahko bil v intervalu od 0,15 do 0,25.

• Kazalnik odstopanja od povpreˇcja prejˇsnjih let. Izraˇcuna absolutno razliko med povpreˇcno oceno nekega leta in povpreˇcno oceno prejˇsnjih nekaj let. Ta kazalnik je pomemben za pregled spreminjanja povpreˇcnih ocen. ˇCe je odstopanje od povpreˇcja prejˇsnjih let zelo visoko, to najbrˇz pomeni, da je bil predmet v tem letu precej laˇzji ali precej teˇzji.

7. Analize ocen ˇstudentov skozi ˇcas ˇstudiranja

7.1. Opis analize. V tej analizi nas zanima gibanje ocen ˇstudentov skozi celoten ˇstudij. Zanima nas, ali so ocene lepo uravnoteˇzene skozi celoten ˇstudij, ali pa so morda s ˇcasom vedno viˇsje oziroma vedno niˇzje. Tako lahko ugotovimo, kateri letniki so teˇzji in kateri laˇzji za ˇstudente. Analizo sestavlja en sam graf, ki kaˇze povpreˇcno oceno ˇstudenta izbrane smeri in izbrane generacije (torej izberemo leto njegovega

(15)

Slika 6. Graf povpreˇcnih ocen ˇstudentov smeri Matematika genera- cije 2011. Izpitna obdobja se ˇstejejo po vrsti, od zaˇcetka ˇstudija na- prej.

zaˇcetka ˇstudija) skozi izpitna obdobja. Na abscisni osi imamo zaporedno izpitno obdobje v ˇstudiju ˇstudenta, na ordinatni pa povpreˇcno oceno (primer: Slika 6 in Slika 7). Izpitna obdobja so zimsko, poletno in jesensko, zanima pa nas analiza prvih 3 let ˇstudija, torej prvih 9 izpitnih obdobij. Naˇceloma analiziramo ocene ˇstudentov, ki so v isti generaciji (so se vpisali istega leta na program), saj so imeli podoben potek ˇstudija (iste predmete, profesorje).

7.2. Postopek obdelave podatkov. V tabelo Dogodki dodamo stolpec GENE- RACIJA, ki za vsakega ˇstudenta izpiˇse leto prvega vpisa na program. Stolpec je pomemben, saj bomo velikokrat v nadaljevanju ˇstudente zdruˇzevali glede na ta stol- pec.

V tabelo Dogodki je dodan tudi stolpec ROK OCENE, ki za vsako pridobljeno oceno opredeli, v katerem izpitnem obdobju je bila pridobljena. To storimo tako, da pogledamo datum pridobljene ocene (mesec). Potem iz stolpcev ROK OCENE in LETNIK izraˇcunamo izpitno obdobje po vrsti.

Podatke (tabelo Dogodki) nato filtriramo tako, da doloˇcimo ˇzeljeno smer in gene- racijo, potem pa podatke o ocenah zdruˇzimo glede na zaporedno izpitno obdobje in za vsako izraˇcunamo povpreˇcno oceno in povpreˇcno oceno vaj.

7.3. Uporabna vrednost analize. S to vrsto analize gledamo trende gibanja ocen.

Na grafu so dejanski podatki (povpreˇcne ocene) predstavljeni s toˇckami. Na grafu so narisane tudi krivuje, ki nekako aproksimirajo te toˇcke. Narisane so, da laˇzje in bolj pregledno vidimo trend gibanja ocen. ˇCe bi ˇzeleli, da je ocenjevanje ˇcimbolj enakomerno preko ˇstudija, bi priˇcakovali, da trend rasti ocen stagnira. Zaˇzeljen naj

(16)

Slika 7. Graf povpreˇcnih ocen ˇstudentov smeri Praktiˇcna matema- tika generacije 2014

bi bil tudi trend manjˇse rasti povpreˇcnih ocen zaradi razliˇcnih dejavnikov: privajanje na sistem ocenjevanja, izpisovanje manj uspeˇsnih ˇstudentov (nadaljujejo samo tisti, ki so bolj uspeˇsni).

Na Sliki 6 pa vidimo, da graf povpreˇcnih ocen ˇstudentov Matematike generacije 2011 ne ustreza nobenemu od zgoraj navedenih ˇzeljenih trendov gibanja ocen. Pov- preˇcna ocena je na zaˇcetku ˇstudija in proti koncu viˇsja kakor na sredini. Predvsem drastiˇcen je padec tako ocen kot tudi ocen vaj v ˇcetrtem, petem in ˇsestem izpitnem obdobju, kar za veˇcino ˇstudentov pomeni v drugem letniku. Interpretacija tega bi bila, da je bil bodisi drugi letnik smeri Matematike za ˇstudente generacije 2011 teˇzji od prvega in tretjega, bodisi pa so bile podeljene ocene v drugem letniku prenizke.

Za ugotovitev razloga bi se lahko obrnili na analizo ocen ˇstudentov po predmetih iz prejˇsnjega poglavja.

Graf na Sliki 7 je precej bolj uravnoteˇzen in ima eno od ˇzeljenih oblik. ˇStudentje Praktiˇcne matematike generacije 2014 so skozi celoten ˇstudij dobivali bolj ali manj podobne ocene, vsako leto sicer malo viˇsje, kar pa lahko pripiˇsemo izkuˇsnjam (po- znavanjem sistema ocenjevanja na fakulteti).

Dobra lastnost te analize je, da nazorno prikaˇze gibanje ocen. ˇZe na prvi pogled lahko opazimo trende za doloˇcen ˇstudij in doloˇceno leto. Pomanjkljivost pa je pred- vsem ta, da so morda nekateri predmeti v doloˇcenih letnikih zelo teˇzki, ko pa jih enkrat ˇstudenti opravijo, pa so ocene solidne. Ocene zato ne nujno odraˇzajo zahtev- nosti letnikov ali izpitnih obdobij. Zato je za dopolnitev te analize pomembna tudi analiza v naslednjem poglavju, analiza pretoˇcnosti ˇstudentov skozi predmete.

7.4. Vpliv anonimizacije. Ker anonimizacija zgodovino vsakega ˇstudenta prema- kne na nakljuˇcno mesto dopustnega obdobja, vsakemu ˇstudentu poslediˇcno priredi povsem nakljuˇcno generacijo. Zato so ˇstudenti, ki v anonimiziranih podatkih sodijo

(17)

v isto generacijo, v pravih podatkih povsem nakljuˇcno nabrani iz celotnega obdobja.

Anonimizacija ocen pa ne vpliva na trende rasti, saj so vse ocene anonimizirane na isti naˇcin. Viˇsje ocene so tudi po anonimizaciji praviloma viˇsje, niˇzje pa praviloma niˇzje.

7.5. Numeriˇcni kazalniki.

• Povpreˇcne ocene v posameznih letih ˇstudiranja in razlike med njimi. Eno ˇstudijsko leto je ponavadi sestavljeno iz treh izpitnih obdo- bij. Izpitna obdobja zato grupiramo po tri, da dobimo zdruˇzene podatke o ˇstudijskih letih. Izraˇcunamo povpreˇcno vrednost vseh ocen (za vsako ˇstudijsko leto posebej). Nato lahko za vsako generacijo primerjamo viˇsino povpreˇcnih ocen, ter razlike med njimi. S pomoˇcjo tega kazalnika dobimo vpogled na nihanje ocen po letih in viˇsino povpreˇcnih ocen po letnikih. Zdi se najbolje, da bi ocene ˇcimmanj nihale skozi ˇstudijska leta.

• Povpreˇcna ocena v izpitnem obdobju. Ocene zdruˇzimo glede na iz- pitno obdobje (zimsko, poletno in jesensko) in pogledamo povpreˇcne ocene in razlike med njimi. Intuitivno se zdi, da naj bi bile ocene, pridobljene v jesenskem izpitnem obdobju v povpreˇcju niˇzje kakor ocene iz zimskega oziroma poletnega izpitnega obdobja. Tisti, ki so najbolje pripravljeni in najbolj vestno ˇstudirajo naj bi namreˇc obveznosti opravili ˇze pred zadnjim izpitnim obdobjem. Po drugi strani pa je ˇcez poletje veˇc ˇcasa za uˇcenje, zato ne moremo z gotovostjo trditi o ustreznosti zgornje zahteve.

8. Analiza pretoˇcnosti ˇstudentov skozi predmete

Slika 8. Graf pretoˇcnosti ˇstudentov skozi predmete za program Fi- nanˇcne matematike, 1. letnik, ki so predmet opravili leta 2012

(18)

Slika 9. Graf pretoˇcnosti ˇstudentov skozi predmete za program Praktiˇcne matematika, 2. letnik, ki so predmet zaˇceli opravljati leta 2012

8.1. Opis analize. Ta analiza se nanaˇsa na pretoˇcnost ˇstudentov skozi predmete.

Za vsak predmet nas torej zanima, kako dolgo ga ˇstudentje opravljajo. Prva moˇznost takˇsne analize bi bila kar izraˇcunan povpreˇcni ˇcas opravljanja predmeta. Takˇsna analiza bi nam ponujala uˇcinkovit pregled, ˇce ne bi imeli ˇstudentje moˇznosti opra- vljanja izpitov pri nekaterih predmetih vnaprej (torej da opravljajo ˇze predmete iz viˇsjih letnikov). ˇCas opravljanja predmeta je namreˇc v tem primeru negativen (-1, ˇ

ce ga ˇstudent opravi eno leto prej kot se vpiˇse v letnik izvajanja predmeta, -2, ˇce ga opravi dve leti prej,...). Pri drugih predmetih pa niti ni mogoˇce opraviti izpitov vnaprej. Zato bi ˇze na zaˇcetku imeli nekateri predmeti viˇsje povpreˇcje ˇcasa opra- vljanja izpitov, pa ˇceprav ne bi bili nujno teˇzji od tistih, ki jih je mogoˇce opravljati vnaprej.

Zato se je treba analize lotiti drugaˇce, na bolj podroben naˇcin. Vanjo so namesto histogramov povpreˇcij vkljuˇceni grafi, ki prikazujejo odstotek ˇstudentov glede na ˇ

cas opravljanja predmeta. Ti grafi se lahko nanaˇsajo bodisi na tiste, ki so predmet priˇceli opravljati doloˇcenega leta (Slika 9), bodisi na tiste, ki so predmet opravili v doloˇcenem letu, opravljati pa so ga priˇceli ˇze prej (Slika 8).

8.2. Priprava podatkov. V tabelo Dogodki dodamo stolpec, ki za vsak predmet pove letnik izvajanja predmeta in ga imenujemo LETNIK IZVAJANJA. Prav tako dodamo tudi stolpec PRVI VPIS V LETNIK IZVAJANJA, ki vrne informacijo, ka- terega leta se je ˇstudent prviˇc vpisal v letnik, kjer se dani predmet izvaja. S pomoˇcjo teh dveh stolpcev lahko izraˇcunamo koliko let je dani ˇstudent predmet opravljal, pre- den ga je uspeˇsno dokonˇcal in to vrednost shranimo v stolpec OPRAVLJANJE LET.

Podatki so nato filtrirani tako, da ohranimo tiste ocene, ki ustrezajo nekemu letu (letu opravljanja ali letu zaˇcetka opravljanja predmeta, kakor ˇzelimo), doloˇcenemu

(19)

programu in letniku. Potem ocene grupiramo po predmetih ter jih preˇstejemo glede na razliˇcne ˇcase opravljanja. Namesto absolutnega ˇstevila ˇstudentov, na grafu na ordinatno os nanaˇsamo odstotek ˇstudentov glede na vse, ki so predmet opravili tistega leta. Tako lahko vse predmete primerjamo med seboj, ne glede na to, koliko ˇstudentov predmet opravlja.

Slika 10. Izsek kode za risanje grafa pretoˇcnosti ˇstudentov skozi predmete v interaktivni spletni aplikaciji Shiny s pomoˇcjo knjiˇznice ggvis

8.3. Uporabnost analize. S pomoˇcjo te analize ugotavljamo predvsem to, kateri predmet v letniku najbolj zavira ˇstudente pri napredovanju v viˇsji letnik. Na grafu so dejanski podatki toˇcke, krivulja pa jih interpolira tako, da se z njimi ujema v vrednostih, odvodi krivulje v vsaki notranji toˇcki za nek predmet pa so enaki niˇc.

To nima nobenega matematiˇcnega pomena, krivulje samo prispevajo k boljˇsi pregle- dnosti podatkov. Porazdelitev ocen je namreˇc diskretna, krivulje samo posnemajo obliko porazdelitve (histograma).

Praviloma naj bi veljalo to, da je predmet, ki ga najmanjˇsi odstotek ˇstudentov opravi v prvem letu ali v naprej, najteˇzji. Tudi za teˇzak predmet bi moralo veljati, da veˇc kot polovica ˇstudentov predmet opravi takoj (isto leto, kot ga zaˇcne opravljati).

Ce si pogledamo Sliko 8, so skoraj vsi predmeti dovolj lahki, da jih opravi bistvenoˇ veˇc kot polovica vseh ˇstudentov, razen predmeta Analiza II. Ta predmet bi lahko bil primer preteˇzkega predmeta za ˇstudij, oziroma je postavljen v prenizek letnik ˇstudija Finanˇcne matematike. Z vidika prelahkih predmetov v oˇci hitro padejo tisti, ki jih takoj opravijo skoraj vsi. Na Sliki 8 je to Raˇcunalniˇski praktikum, saj ga opravi v prvem letu skoraj vsak ˇstudent.

Analiza pokaˇze tudi primer, ˇce je predmet za nek letnik prelahek. To pomeni, da ga velik del ˇstudentov naredi ˇze v naprej (ko ˇse niso v letniku izvajanja). Na Sliki 9 je predmet Matematika v praksi na programu Praktiˇcna matematika prelahek, saj ga vnaprej opravi skoraj polovica ˇstudentov.

(20)

Dobra lastnost te analize je, da se problematiˇcni predmeti (prelahki ali preteˇzki) hitro opazijo, saj ima veˇcina neproblematiˇcnih predmetov zelo podobno krivuljo na grafu. Je pa res, da ta analiza upoˇsteva samo tiste ˇstudente, ki so predmet tudi uspeˇsno opravili. Velik problem na ˇstudijih namreˇc predstavljajo ˇse posebej tisti predmeti, ki so tako teˇzki, da se ˇstudenti zaradi njih prepisujejo, predmeta pa tako nikoli je opravijo.

8.4. Vpliv anonimizacije. Anonimizacija te analize ne pokvari, saj potek ˇstudija vsakega ˇstudenta ostane enak kakor na originalnih podatkih (anonimizacija ne spre- minja trajanja opravljanja predmetov pri ˇstudentih). Problematika nastane, kadar se pri posameznem predmetu zamenja uˇcni naˇcrt ali profesor. Podatki so namreˇc po anonimizaciji ˇcasovno premeˇsani in jih ne moremo veˇc loˇciti ˇcasovno (ˇce ˇzelimo primerjati prejˇsnji uˇcni naˇcrt ali prejˇsnjega profesorja z novejˇsim).

8.5. Numeriˇcni kazalci.

• Kazalnik teˇzkih/lahkih predmetov. Za kazalnik preteˇzkih ali prelahkih predmetov lahko za nek predmet preprosto vzamemo deleˇz ˇstudentov, ki dani predmet opravijo isto leto, kot se nanj vpiˇsejo, ali ˇze prej, glede na vse ˇstudente, ki so predmet opravili. ˇCe bo vrednost kazalnika dovolj visoka (velik deleˇz ˇstudentov nima teˇzav s predmetom), potem predmet ni preteˇzek.

V praksi bi lahko vrednost, veˇcja od 0,7 pomenila, da predmet ni preteˇzek.

Ce predmet takoj opravi veˇˇ c kot 95% ˇstudentov, bi to lahko pomenilo, da je predmet morda prelahek. Predlagane idealne vrednosti tega kazalca naj bi torej bile med 0,70 in 0,95.

9. Analiza pretoˇcnosti ˇstudentov skozi ˇstudije

9.1. Opis analize. Analiza pretoˇcnosti ˇstudentov skozi ˇstudije ima podoben cilj kot analiza pretoˇcnosti ˇstudentov skozi predmete. Razlika je v tem, da iˇsˇce trende opra- vljanja na nivoju celotnih letnikov in ne predmetov. Analiza obsega dve vizualizaciji, eno s sonˇcnim diagramom in eno z diagramom pretoˇcnosti. Obe sta interaktivni (ˇce se z miˇsko zapeljemo ˇcez graf, nam nudi dodatne in bolj podrobne informacije o njem). Primer interaktivnosti za sonˇcni diagram je prikazan na Sliki 13. V kolikor se z miˇsko zapeljemo po zunanjem kolobarju, se pokaˇze odstotek tovrstnih prehodov in ˇstevilo. Obe vrsti vizualizacije nam (vsaka na svoj naˇcin) nudita pregled o deleˇzu opravljanja letnikov na nekem programu, razliˇcne barve pa predstavljajo razliˇcno trajanje opravljanja letnika.

9.2. Priprava podatkov. Za vsakega ˇstudenta pogledamo celotno njegovo zgodo- vino iz tabele Dogodki in mu pripiˇsemo stolpce:

• N: zaporedna ˇstevilka dogodka ˇstudenta

• PREJ: program, na katerem je bil prejˇsnji dogodek ˇstudenta

• PO: program, na katerem je bil naslednji dogodek ˇstudenta

• ZGODOVINA ID: zaporedni program ˇstudenta (ˇce se je prepisoval)

• ZGODOVINA N: zaporedni dogodek ˇstudenta na tem programu

• 1, 2, 3, 4, 5, DodL, PodL: leta obiskovanja letnikov tega ˇstudenta

S pomoˇcjo teh stolpcev bomo za vsakega ˇstudenta laˇzje doloˇcili ˇcas opravljanja letnikov.

TabeloDogodki filtriramo tako, da izberemo ˇzeljeno generacijo in se omejimo samo na vpise ˇstudentov v viˇsje letnike. Potem je za vsakega ˇstudenta potrebno izraˇcunati

(21)

Slika 11. Diagram pretoˇcnosti ˇstudentov skozi letnike za program Matematika, generacije 2010

ˇ

case prehodov. To storimo tako, da primerjamo leta vpisov v prejˇsnji in naslednji letnik in izraˇcunamo razliko. Na koncu ˇstudente grupiramo po skupinah glede na ˇcas opravljanja (pri diagramu pretoˇcnosti za vsak letnik posebej, pri sonˇcnem diagramu pa za celoten potek ˇstudija). Tako pripravljene podatke samo ˇse preˇstejemo in nariˇsemo oba grafa.

9.3. Razlaga diagrama pretoˇcnosti. Diagram pretoˇcnosti prikazuje sorazmerni pretok med spremenljivkami (ali vozliˇsˇci) znotraj omreˇzja. V naˇsem primeru zelo dobro in nazorno prikaˇze celoten ˇstudij (od prvega letnika do diplome) glede na uspeˇsnost (ali so ˇstudentje nek letnik sploh dokonˇcali) in tudi glede na trajanje opravljanja letnika (z razliˇcnimi barvami so oznaˇcena razliˇcna trajanja opravljanja).

Graf na Sliki 11 prikazuje potek opravljanja ˇstudija ˇstudentov Matematike, ki so zaˇceli ˇstudirati na tem programu leta 2010. Vozliˇsˇca prestavljajo letnike, povezave pa prehode med njimi. Debelina vsake povezave ponazarja ˇstevilo ˇstudentov, barva pa ˇcas opravljanja letnika. Svetlo zelena predstavlja takojˇsnje dokonˇcanje letnika (ˇcas opravljanja je tako enak 0). To se najveˇckrat zgodi pri prehodu iz tretjega letnika do dokonˇcanja diplomskih nalog, ˇce jih ˇstudentje napiˇsejo ˇse isto leto, kot konˇcajo tretji letnik. Temno zelena pomeni, da so ˇstudentje za dokonˇcanje letnika rabili eno leto, rumena pomeni dve leti in rdeˇca veˇc kot dve leti. Siva povezava iz vozliˇsˇca letnika pomeni, da ˇstudent letnika ni ˇse opravil do ˇcasa, ko so bili podatki pridobljeni. Pri izrisu diagrama si v programu R pomagamo s knjiˇznico networkD3.

9.4. Razlaga sonˇcnega diagrama. Sonˇcni diagram se uporablja za vizualizacijo hierarhiˇcnih podatkov, ki jih prikazujejo koncentriˇcni krogi. Krog v centru predsta- vlja korensko vozliˇsˇce s hierarhijo, ki poteka od srediˇsˇca navzven. Vsak kolobar je

(22)

torej podskupina svojega notranjega soseda. Za potrebe naˇse vizualizacije posame- zni kolobarji predstavljajo posamezne letnike (notranji kolobar predstavlja trajanje opravljanja prvega letnika, srednji ˇcas opravljanja drugega letnika, zunanji pa ˇcas od vpisa v tretji letnik do opravljene diplome). Barve so razliˇcne glede na trajanje, opis pomena vsake barve pa je prikazan v legendi. V okolju R sonˇcni diagram nariˇsemo s pomoˇcjo knjiˇznice sunburstR.

Slika 12. Sonˇcni diagram pretoˇcnosti ˇstudentov skozi letnike za pro- gram Finanˇcna matematika, generacije 2010

9.5. Uporabnost analize. Obe analizi ponujata celosten pregled o trajanju opra- vljanja ˇstudija ˇstudentov, ter o uspeˇsnosti opravljanja obveznosti. V diagramu pretoˇcnosti je za problematiko preteˇzkega ˇstudija pomembno, da sive povezave v diagramu (ˇstudentje, ki ˇstudija nikoli niso zakljuˇcili) niso predebele, hkrati pa ne smejo biti pretanke. Na Sliki 11 bi teˇzavo predstavljala predebela povezava iz 1. le- tnika v vozliˇsˇceNiso ˇse dokonˇcali. Veˇc kot polovica tistih, ki so se lotili opravljanja 1. letnika programa Matematike, ga niso nikoli dokonˇcali: bodisi so se prepisali na drugo smer ali ˇstudij opustili. Glede barvne strukture (razmerji med zeleno, rumeno in rdeˇco ter razmerji med svetlo in temno zeleno za diplomiranje) se zdi ˇstudij Mate- matike iz Slike 11 za generacijo 2010 dobro zastavljen (veˇcina jih letnike opravlja v prvem poskusu, nekaj pa tudi ne). Potrebno je tudi poudariti, da diagrama prikazu- jeta slabˇso pretoˇcnost za bolj pozna leta (za tiste ˇstudente, ki so ˇse ˇstudirali ob ˇcasu pridobivanja podatkov). Precej bolj debele so v diagramu pretoˇcnosti na primer sive povezave, saj diagram v skupino Niso ˇse dokonˇcali uvrˇsˇca tudi vse ˇstudente, ki letnik ˇse opravljajo (in ga bodo v prihodnosti morda tudi uspeˇsno dokonˇcali).

Sonˇcni diagram ponazarja podobno shemo, le da je ta v obliki kroga. Diagram pretoˇcnosti se z njo ne razlikuje zgolj v obliki, temveˇc ponuja tudi nekoliko drugaˇcno informacijo. Diagram pretoˇcnosti namreˇc prikazuje prehode iz letnika v letnik brez informacije o tem, kako je ˇstudent predhodno opravljal ˇstudij. Sonˇcni diagram pa

(23)

Slika 13. Prikaz interaktivnosti sonˇcnega diagrama

ˇstudente povsem loˇci glede na razliˇcen naˇcin (trajanje) opravljanja ˇstudija. Iz njega teˇzko razberemo, koliko je celoten letnik teˇzak, laˇzje kot v diagramu pretoˇcnosti pa iz njega ugotovimo problematiko glede na razliˇcne skupine ˇstudentov (na primer:

kako gre v nadaljevanju ˇstudija tistim, ki so prvi letnik opravljali veˇc kot eno leto).

Sonˇcni diagram torej nekako dopolnjuje diagram pretoˇcnosti: ˇce opazimo teˇzave v nekem letniku v diagramu pretoˇcnosti, lahko razloge za te teˇzave iˇsˇcemo s sonˇcnim diagramom ali z analizo pretoˇcnosti skozi predmete. Na primeru Slike 12 vidimo, da ˇstudentje Finanˇcne matematike generacije 2010, ki prvega letnika niso opravili takoj, vseeno podobno hitro opravljajo drugi letnik in diplomo, kot tisti, ki jim je prvi letnik uspelo narediti v enem letu. Oˇcitno je razlog za teˇzave v prvem letniku neprilagojenost na sistem dela na fakulteti, bolj kot nezmoˇznost.

9.6. Vpliv anonimizacije. Podobno kakor pri analizi pretoˇcnosti ˇstudentov skozi predmete, anonimizacija ne vpliva na ˇcasovne intervale pri posameznih ˇstudentih, zato je tudi pretok programa za vsa leta povsem nespremenjen. Anonimizacija vpliva edino na analizo po letih. Ker je zaˇcetek ˇstudij vsakega ˇstudenta premaknjen na nakljuˇcno leto, teˇzko primerjamo pretoˇcnost ˇstudijev glede na leta.

9.7. Kazalniki.

• Kazalnik uspeˇsnosti v prvem letniku. Kazalnik nam izraˇcuna odstotek uspeˇsnih v 1. letniku: vse, ki so prvi letnik uspeˇsno opravili deli z ˇstevilom vseh, ki so se v 1. letnik vpisali. Kazalnik je pomemben za doloˇcanje odstotka tistih, ki se najveˇc prepisujejo iz programa (in poslediˇcno nikoli ne zakljuˇcijo ˇstudija). Alternativno bi lahko uporabili tudi kazalec, ki bi izraˇcunal deleˇz vseh tistih, ki s ˇstudijem nikoli niso zakljuˇcili. Dobre vrednosti tega kazalnika naj bi bile veˇcje od 0,5. Potrebno je tudi poudariti, da ta kazalnik prikazuje slabˇse vrednosti za bolj pozna leta (bolj pozne generacije). Nekateri namreˇc

(24)

prvi letnik zakljuˇcijo ˇse po tem, ko so podatki ˇze pridobljeni. Zato bi bolj relevantne in toˇcne vrednosti kazalnik pokazal ˇsele ˇcez nekaj let.

• Kazalnik pretoˇcnosti programa. Kazalnik izraˇcuna deleˇz ˇstudentov, ki so dodiplomski ˇstudij opravili v manj kot petih letih, med tistimi, ki so program uspeˇsno dokonˇcali. Tako dopuˇsˇcamo vsakemu ˇstudentu enkrat ponavljanja letnika ali leto pisanja diplome. Program je dobro pretoˇcen, ˇce je vrednost kazalnika nad 0,9.

• Primerjava letnih kazalnikov z veˇcletnimi. Oba zgornja kazalnika za posamezno leto lahko primerjamo z istima kazalnikoma, izraˇcunanima na celotnih podatkih (ali veˇc letih). Potem lahko primerjamo, katera generacija ali leto najbolj odstopa od povpreˇcja kazalnikov.

Slika 14. Kazalnika pretoˇcnosti ˇstudentov skozi ˇstudije za programe, leto vpisov 2011

10. Analiza prepisov ˇstudentov med programi

Slika 15. Diagram strun prepisov na prvi stopnji za celotne podatke

(25)

Slika 16. Diagram strun prepisov na drugi stopnji za leto 2014

10.1. Opis analize. Analiza prepisov se osredotoˇca na prepise med programi iste fakultete. Vsebuje dve vizualizaciji: Diagram strun, ki kaˇze ˇstevilo prepisov na prvi ali drugi stopnji bodisi v letu, bodisi v ˇcasovnem obdobju in Casovno analizo pre-ˇ pisov, ki vizualizira spreminjanje ˇstevila prepisov na relaciji dveh smeri. Diagram strun je uporaben predvsem za hiter pregled najveˇcjega ˇstevila prehodov med smermi (iz katere in v katero smer se najveˇc ˇstudentov prepisuje). Histogrami, ki vraˇcajo ˇstevilo prehodov med dvema programoma v razmerju s ˇcasom, pa so pomembni za pregled spreminjanja trednov prepisovanja. Z njihovo pomoˇcjo lahko vidimo raz- like v ˇcasovnem spreminjanju prepisov. Relevantno je gledati samo prepise znotraj iste fakultete, saj ˇstudentje ob prepisu na kakˇsno drugo fakulteto zamenjajo vpisno ˇstevilko.

10.2. Priprava podatkov. V tabeli Dogodki se omejimo na tiste vpise, kjer je stolpec PREJ (program na katerem je bil prejˇsnji dogodek istega ˇstudenta) drugaˇcen od stolpca PROGRAM ID (program, na katerega se je ˇstudent vpisal). Tak dogodek ponazarja prepis iz smeri PREJ na smeri PROGRAM ID. Dogodke ˇse grupiramo glede na relacije prepisov in jih preˇstejemo.

10.3. Razlaga diagrama strun. Diagram strun predstavlja tokove ali povezave med veˇc entitetami (imenovanimi vozliˇsˇca). Vsaka entiteta je predstavljena z odse- kom zunanjega dela kroga. Nato se med posameznimi entitetami nariˇsejo povezave (loki). Debelina loka je sorazmerna s pomembnostjo pretoka. Debelina loka iz vo- zliˇsˇcaAv vozliˇsˇceB je razliˇcna blizu obeh vozliˇsˇc. Debelina povezave blizu vozliˇsˇca A nakazuje pomembnost pretoka iz A v B, debelina blizu vozliˇsˇca B pa predstavlja pomembnost pretoka iz B v A.

V naˇsem diagramu strun vozliˇsˇca predstavljajo posamezne smeri, povezave med njimi pa prepise ˇstudentov. Debelina vsake povezave je sorazmerna s ˇstevilom pre- pisov iz smeri.

Diagram strun je interaktiven. Ko z miˇsko preletimo nad povezavo, se na zaslon izpiˇse ˇstevilo prepisov v vsaki smeri povezave.

(26)

V okolju R diagram strun riˇsemo s pomoˇcjo knjiˇznice chorddiag.

Slika 17. Prehodi iz smeri Finanˇcna matematika na smer Praktiˇcna matematika

Slika 18. Prehodi iz smeri Praktiˇcna matematika na smer Finanˇcna matematika

(27)

10.4. Uporabnost analize. Analiza prepisov ˇstudentov med programi ugotavlja ˇ

casovne trende prepisov. Z njeno pomoˇcjo ˇzelimo izvedeti iz katerega programa se najveˇc ˇstudentov prepisuje, v katerega se prepisujejo in na kateri relaciji je najveˇc prepisov. Zanima nas tudi ˇcasovno spreminjanje prepisov na dveh smereh.

S pomoˇcjo diagrama strun (Slika 15 in Slika 16) lahko ugotavljamo ˇstevilo pre- pisov za neko obdobje na relacijah med predmeti iste stopnje. Diagram na Sliki 15 vizualizira prepise na prvi stopnji programov Fakultete za matematiko in fiziko, smeri matematika, za vse podatke (celotno ˇcasovno obdobje podatkov). Diagram je dobro uravnoteˇzen, debelina nobene povezave ne izstopa. To pomeni, da se iz nobene smeri niso ˇstudenti mnoˇziˇcno prepisovali. ˇSe najveˇc ˇstudentov se je prepi- salo iz smeri Matematika, kar pa je v skladu s priˇcakovanji, saj ta program velja za najteˇzjega in najbolj kompleksnega.

Teˇzave vizualizacije z diagramom strun bi se lahko pojavile, ˇce je prepisov zelo malo. Diagram na Sliki 16 je narisan na samo ˇsest podatkih (tri prepisi iz Matema- tike na Finanˇcno matematiko in tri prepisi iz smeri IˇSRM na Finanˇcno matematiko).

Ce opazujemo samo diagram, se zdi prepisovanje precej problematiˇˇ cno, saj prikazuje mnoˇziˇcno prepisovanje na smer Finanˇcne matematike (ˇceprav se je prepisalo samo ˇsest ˇstudentov). Pri teh diagramih je torej potrebno paziti, da ne sklepamo prehitro in vedno pogledamo ˇstevilo podatkov.

Drugi del analize se bolj osredotoˇca na ˇcasovne trende prepisovanja (histograma na Sliki 17 in Sliki 18). S pomoˇcjo teh histogramov ˇzelimo opaziti trende prepisovanja skozi ˇcas. Zanima nas ali se ˇstevilo prepisov poveˇcuje ali zmanjˇsuje in v skladu s to ugotovitvijo iskati razloge za takˇsne trende. Za oba ˇstudija je najbolje, ˇce se ˇstevilo prepisov niti ne poveˇcuje, niti ne zmanjˇsuje. Takˇsen primer vidimo na Sliki 17, ki vizualizira prepisovanje iz smeri Finanˇcna matematika v smer Praktiˇcna matematika na prvi stopnji. Histogram na Sliki 18, ki prikazuje prepise iz Praktiˇcne matematike na Finanˇcno matematiko, pa nakazuje trend vse veˇcjega prepisovanja na tej relaciji. ˇStevilo prepisov se predvsem v zadnjih letih moˇcno poveˇcuje. To za oba ˇstudija ni najbolj optimalno, preveˇc ˇstudentov (predvsem prvih letnikov) se vpiˇse na program Praktiˇcne matematike, kjer pa niso najbolj zadovoljni. Potem se prepiˇsejo na Finanˇcno matematiko. Ena od reˇsitev za takˇsne teˇzave bi bila na primer sprememba v oglaˇsevanju ˇstudijev (za srednjeˇsolce).

10.5. Vpliv anonimizacije. Anonimizacija, kot smo ˇze pri vsaki vrsti analize do- slej poudarili, podatke bistveno popaˇci predvsem na ˇcasovnem vidiku. Najbolj torej vpliva na verodosojnost histograma o ˇcasovnih spremembah prepisov. Na ˇstevilo prepisov in ponovnih vpisov kot celoto anonimizacija ne vpliva.

10.6. Kazalniki.

• Kazalnik ˇcasovnega vidika prepisov. Toˇcke na grafu ˇstevila prepisov na neki relaciji v odvisnosti od leta aproksimiramo s premico po metodi najmanjˇsih kvadratov y =k·t+n. Pri tem y ponazarja ˇstevilo prepisov, t pa ˇcas. Za kazalnik lahko vzamemo kark, koeficient naraˇsˇcanja premice. ˇCe jek > 0, pomeni, da se ˇstevilo prepisov skozi leta na ˇzeljeni relaciji povpreˇcno poveˇcuje, ˇce pa je k < 0, pomeni, da se ˇstevilo prepisov zmanjˇsuje. Najbolj si ˇzelimo, da ˇstevilo prepisov ostaja enako, torej kazalnik okoli 0.

• Kazalnik prepisov na programih. Ta kazalnik nam pove, ˇce se ˇstudenti mnoˇziˇcno prepisujejo na nek program ali iz njega. Za program je najbolj pomembno, da je razmerje med prepisovanjem vanj in izpisovanjem iz njega

(28)

pribliˇzno enako. ˇStevilo ˇstudentov tako ostane nespremenjeno. Kazalnik je zato kar koliˇcnik med celotnimi prepisi v dani program in celotnimi prepisi iz njega. Pri tem dodamo pravilo, da je 00 = 1 in x0 = ∞, za x ∈ N. Ide- alna vrednost kazalnika je okoli 1, normalne vrednosti pa naj bi se gibale v intervalu od 0,75 do 1,33. Pri tem kazalniku je potrebno upoˇstevati do- volj veliko ˇstevilo prepisov med programi, sicer lahko dobimo zelo velike ali majhne vrednosti kazalnika, kar pa ne nujno odraˇza prave slike med prepisi.

Slika 19. Kazalnik ˇcasovnega vidika prepisov za programe prve stopnje

11. Cilji in zakljuˇcek

Vse analize skupaj tvorijo dokaj slikovit in razviden pregled znaˇcilnosti in kako- vosti ˇstudija.

Zamisel celotne analize je, da najprej pogledamo kazalnike za vse programe, leta, relacije med programi, ki jih ˇzelimo analizirati. Ce kazalniki kaˇˇ zejo ugodne vre- dnosti, nadaljna analiza ni potrebna. Pri kazalnikih, kjer se pojavijo odstopanja, pa opravimo ˇse dodatne analize in vizualizacije. Iz grafov lahko potem podrobno razberemo, zakaj je kazalnik izven normalnih vrednosti in iˇsˇcemo razloge za to.

V nadaljevanju razvijanja metod kakovosti ˇstudija bi lahko analizirali ˇse vpliv srednjeˇsolske izobrazbe na uspeˇsnost ˇstudiranja. Lahko bi primerjali pretoˇcnost ˇstudentov, ki so se ˇze na zaˇcetku vpisali na program, s pretoˇcnostjo tistih, ki so se na program prepisali (iz nekega drugega programa). Lahko bi primerjali ocene glede na spole.

Nadzor kakovosti ˇstudijev, kot je opisana v tej diplomski nalogi, naj bi zajemala vse najpomembnejˇse vidike ˇstudija in bi lahko bila zadostna vsaj za zaˇceten pregled ˇstudijev, njihove evalvacije in odkrivanja veˇcjih in bolj problematiˇcnih lastnosti.

Slovar strokovnih izrazov

CSV, comma-separated values CSV – tip datoteke, v katero ponavadi shranju- jemo tabele

data frame razpredelnica NA, not available ni na voljo Sunburst diagram sonˇcni diagram Sankey diagram diagram pretoˇcnosti Chord diagram diagram strun

numeric ˇstevilski

(29)

Literatura

[1] A. Pogaˇcnik. Slovar slovenskega knjiˇznega jezika 2017. Zaloˇzba ZRC, ZRC SAZU, 2018.

[2] Data protection, v: European Comission, [ogled 12. 7. 2021], dostopno na https://ec.

europa.eu/info/law/law-topic/data-protection_en.

[3] Sunburst Diagram, v: Data Viz Project, [ogled 15. 7. 2021], dostopno na https:

//datavizproject.com/data-type/sunburst-diagram/#:~:text=A\%20Sunburst\

%20Diagram\%20is\%20used,moving\%20outward\%20from\%20the\%20center.

[4] Sankey Diagrams: Six Tools for Visualizing Flow Data, v: Azavea, [ogled 15. 7. 2021], dosto- pno nahttps://www.azavea.com/blog/2017/08/09/six-sankey-diagram-tool/.

[5] Chord diagram, v: from Data to Viz, [ogled 26. 7. 2021], dostopno na https://www.

data-to-viz.com/graph/chord.html.

[6] Poslanstvo, vizija, vrednote in strateˇski cilji, v: Nacionalna agencija Republike Slovenije za kakovost v visokem ˇsolstvu, [ogled 27. 7. 2021], dostopno na https://www.nakvis.si/

o-agenciji/poslanstvo-vizija-vrednote-in-strateski-cilji/.

[7] What is R?, v: The R Foundation, [ogled 8. 8. 2021], dostopno nahttps://www.r-project.

org/about.html.

[8] RStudio, v: RStudio, [ogled 9. 8. 2021], dostopno nahttps://www.rstudio.com/products/

rstudio/.

[9] Shiny, v: RStudio, [ogled 9. 8. 2021], dostopno na https://shiny.rstudio.com/.

Reference

POVEZANI DOKUMENTI

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in raˇ cunalniˇstvo Matematika 1.. KOLOKVIJ IZ

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in raˇ cunalniˇstvo Matematika 1.. KOLOKVIJ IZ

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in raˇ cunalniˇstvo Matematika 1.. del pisnega izpita iz

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in ra£unalni²tvo. Izpit pri predmetu DISKRETNA

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in ra£unalni²tvo. Izpit pri predmetu DISKRETNA

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in ra£unalni²tvo Izobraºevalna matematika.. Izpit pri predmetu KOMBINATORIKA

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in raˇ cunalniˇstvo Matematika

Fakulteta za naravoslovje in matematiko Oddelek za matematiko in raˇ cunalniˇstvo Matematika