• Rezultati Niso Bili Najdeni

Profili znanstvenih objav slovenskih raziskovalcev – analiza simbolnih podatkov

N/A
N/A
Protected

Academic year: 2022

Share "Profili znanstvenih objav slovenskih raziskovalcev – analiza simbolnih podatkov"

Copied!
57
0
0

Celotno besedilo

(1)

UNIVERZA V LJUBLJANI FAKULTETA ZA DRUŽBENE VEDE

Gregor Lasnibat

Profili znanstvenih objav slovenskih raziskovalcev – analiza simbolnih podatkov

Diplomsko delo

Ljubljana, 2021

(2)

UNIVERZA V LJUBLJANI FAKULTETA ZA DRUŽBENE VEDE

Gregor Lasnibat

Mentor: doc. dr. Luka Kronegger

Profili znanstvenih objav slovenskih raziskovalcev – analiza simbolnih podatkov

Diplomsko delo

Ljubljana, 2021

(3)

Zahvala Hvala doc. dr. Luki Kroneggerju za strokovno vodenje, pomoč pri osmišljanju problematike in odlična pojasnila.

(4)

Profili znanstvenih objav slovenskih raziskovalcev – analiza simbolnih podatkov

Pretekle analize bibliometričnih podatkov in pozorna opazovanja kažejo, da obstajajo znatne razlike in razhajanja v mnogih vidikih delovanja med posameznimi raziskovalnimi področji.

Pričujoče delo uvodoma razčleni krovno problematiko razlik, jih podrobno predstavi in podkrepi s podatki analiz, nato pa na teh temeljih preverja hipoteze o pojavnosti različnih profilov frekvence znanstvenih objav slovenskih raziskovalcev. Praktični del naloge obravnava analizo simbolnih podatkov, pridobljenih iz baze SICRIS, konkretno objave slovenskih znanstvenikov v obliki izvirnih znanstvenih člankov za njihovih prvih 15 let delovanja, delujočih od 1922 do 2017. Analiza, izvedena s prilagojeno metodo voditeljev in s prilagojeno metodo Wardovega hierarhičnega združevanja, pokaže na obstoj različnih profilov pogostosti objavljanja, postanaliza pa na vpliv znanosti, kot tudi spola, na razlike med analiziranimi profili.

Ključne besede: Analiza simbolnih podatkov, razvrščanje v skupine, profili znanstvenih objav, razlike med naravoslovjem in družboslovjem.

Profiles of scientific papers by Slovenian academics – an analysis of symbolic data

Previous analyses of bibliometric data and careful observations indicate marked differences and deviations in many facets of scientific operationalization observed between different sciences. This thesis elaborates on this umbrella issue of differences, presents them in further detail, supports them with concrete evidence stemming from analysis data, and then hypothesizes on the emergence of different profiles of scientific publishing of Slovenian researchers. The practical part of the thesis concerns the analysis of symbolic data obtained from the SICRIS database, specifically the publishing of Slovenian scientists in the form of original scientific articles for their first 15 years of operation, encompassing scientists writing from 1922 to 2017. The analysis carried out using adapted leaders method and adapted Ward's hierarchical clustering method shows the existence of different profiles of scientific publishing, and the post-analysis shows the influence of different sciences as well as gender on the differences between profiles.

Keywords: Analysis of symbolic data, clustering, profiles of scientific publishing, differences between natural and social sciences.

(5)

Kazalo vsebine

1 Uvod ... 7

2 Teoretična umestitev ... 9

2.1 Teorija ... 9

2.1.1 Slovenski znanstveni prostor ... 9

2.1.2 Raziskovalni cikel ... 9

2.1.3 Znanstvena revija ... 10

2.1.4 Vrednotenje znanstvenih revij ... 10

2.1.5 Razlike v raziskovanju in objavljanju ... 11

2.1.6 Razlike v sodelovanju ... 14

2.1.7 Objavljanje doma ali v tujini ... 16

2.1.8 Razlike v družbeno-razvojnih ciljih ... 17

2.1.9 Karierne poti po spolu in disciplini ... 18

2.2 Hipoteze ... 21

2.3 Merjenje ... 21

2.4 Metoda ... 23

2.5 Opis podatkov ... 26

3 Empirični del ... 28

3.1 Orodja ... 28

3.1.1 R in RStudio ... 28

3.1.2 SQL in DB4S ... 28

3.1.3 Python ... 29

3.2 Analiza ... 29

3.2.1 Priprava podatkov ... 29

3.2.2 Združevanje v skupine ... 31

3.3 Opis skupin in interpretacija podatkov ... 34

4 Sklepni del ... 37

4.1 Zaključek ... 37

5 Viri ... 39

Priloge ... 42

(6)

Kazalo slik

Slika 2.1: Prilagojena metoda voditeljev (psevdo koda):... 26 Slika 2.2: Prilagojena aglomerativna Wardova metoda (psevdo koda): ... 26 Slika 3.1: Dendrogram razvrščanja v skupine z Wardovo hierarhično metodo združevanja .. 32 Slika 3.2: Graf trednov objav treh skupin v razponu 15 let ... 33

(7)

1 Uvod

Področje znanosti, njeni različni modusi in discipline, so se skozi njeno zgodovino izkazali kot odlično kognitivno orodje za uspešno človekovo tolmačenje in razumevanje tako naravnih kot tudi družbenih pojavov. Skozi proces destilacije in diferenciacije v funkciji časa so se te discipline razvile v kompleksnejše in konkretnejše znanstvene domene, s sebi lastnimi, specifičnimi metodami.

»Prvi korak v znanstvenem prizadevanju po vzpostavitvi osnovnega razumevanja empiričnih fenomenov je najpogosteje klasifikacija.« (Kronegger, Mali, Ferligoj, in Doreian, 2014, str. 1) Uporaba klasifikacijskih sistemov z ozirom na samo znanost nam tako omogoči, da se lahko ustrezno opredelimo za določen način znanstvenega pristopa, v želji po uspešnem reševanju specifičnega, nearbitrarnega problema.

Nekateri kriteriji klasifikacije znanosti tako razločujejo med nomotetičnimi in ideografskimi znanostmi, kvantitativnimi in kvalitativnimi znanostmi, ter naravno-tehničnimi in družbeno- humanističnimi znanostmi. Obstajajo pa tudi enostavnejša razločevanja, na primer na »trde«

in »mehke« znanosti. (Kronegger in drugi, 2014, str. 1)

V kontekstu moderne znanosti je naravoslovna znanost precej starejša od družboslovne, kar v neki meri botruje tudi razlikam v njunih prizadevanjih in metodah. Čeprav lahko govorimo že o Aristotlu kot očetu politične znanosti, ima družboslovna znanost kot taka začetke šele v 19.

stoletju. Njeni teoretični zametki segajo v leto 1838, z vzpostavitvijo doktrine pozitivizma in definicijo sociologije kot družbene fizike, francoskega filozofa in pisca Augusta Comteja.

Uradno pa nastop sociologije kot krovne vede, sinonimne za družboslovje pripisujemo kasnejšim delom Maxa Webra, Karla Marxa, in še posebno Emila Durkheima, ki je zaslužen za podrobnejšo razdelavo pozitivizma, vzpostavitev prvega oddelka za družboslovje na univerzi v Bordeauxu leta 1895 in objavo njegovih »Pravil družboslovne metode«.

Družboslovna znanost pa je bila skozi zgodovino, navkljub trudom čislanih umov, kot so bili Marx, Weber, Durkheim in še mnogi za njimi, vedno v vlogi subjekta mačehovskega odnosa z naravoslovnimi, »trdimi« znanostmi. Obstajala sta v grobem dva pola – na enem bregu so stali tisti, ki so verjeli, da je »družboslovna znanost«, oziroma natančneje, znanstveno preučevanje nečesa družbenega nepomirljiv oksimoron, in na drugem tako imenovani materialisti, ki so bili mišljenja, da sama »družbenost« družboslovne znanosti ne zajema ničesar, česar se ne bi dalo zreducirati na fizično oziroma naravno in s tem narediti

(8)

spoznavno. (van de Walle, 1932, str. 542)

Resnica morda tiči nekje med dvema ekstremoma. Ustrezno razlikovanje med pristopoma ter posledično primerno izbiranje metod in inštrumentov sta kritičnega pomena za zagotavljanje točnosti in s tem legitimnosti rezultatov. Na to je leta 1952 tudi jasno opozoril avstrijski ekonomist Friedrich Hayek v svoji knjigi »Protirevolucija znanosti« (The Counter-Revolution of Science).

V 21. stoletju je tako postalo splošno razumljeno, da delitev na naravoslovne in družboslovne znanosti obstaja, je utemeljena ter se odraža v številnih odstopanjih, ki se pojavijo tekom procesa ustvarjanja znanstvenega vedenja, od metodologije in načinov preučevanja do citiranja in sodelovanja.

V svoji diplomski nalogi se bom tako ukvarjal z vprašanjem razlik v prolifičnosti znanstvenega objavljanja z ozirom na naravoslovje in družboslovje. Konkretneje, zanimajo me profili znanstvenih objav slovenskih raziskovalcev skozi čas, gledani skozi prizmo delitve naravoslovno-družboslovno.

V drugem, teoretičnem delu svoje diplomske naloge bom najprej prikazal obstoj nekaterih izmed prej omenjenih odstopanj, tako v globalnem kontekstu kot tudi znotraj slovenskega znanstvenega prostora, predstavil svoje hipoteze, izbrani način merjenja in metodo ter vhodne podatke analize. V tretjem, empiričnem delu bom nazorno predstavil uporabljena orodja, opisal svojo analizo in na koncu interpretiral dobljene rezultate. V sklepnem delu bom povzel cilje in rezultate naloge, ter orisal morebitne razmisleke in implikacije za prihodnost.

(9)

2 Teoretična umestitev 2.1 Teorija

2.1.1 Slovenski znanstveni prostor

Slovenski znanstveni prostor je precej majhen. Leta 2016 je v njem delovalo približno 15000 ljudi, od tega 8500 raziskovalcev, zaposlenih v 42 visokošolskih, 47 raziskovalnih in 777 poslovnih institucijah. (Udovič, Bučar, in Hristov, 2016)

Za slovensko znanost je značilna visoka stopnja dinamičnosti, še posebej v obdobjih po politični tranziciji leta 1990. Od začetka dvatisočih se je v prvih desetih letih število raziskovalcev na Slovenskem povečalo za 50 %. Med leti 1996 in 2015 so se bruto domači izdatki na področju znanstvenega raziskovanja in razvoja povečali z 1.33 % na 2.39 % bruto domačega proizvoda, kjer je znašal delež izdatkov znanstvenega raziskovanja in razvoja v poslovne namene kar 3/4 celotne kvote. (Udovič in drugi, 2016)

Tako število raziskovalcev na milijon prebivalcev kot tudi celotna intenziteta znanstvenega raziskovanja in razvoja sta v Sloveniji relativno visoka, sploh kadar ju primerjamo z ostalimi srednje in vzhodno evropskimi državami. (OECD, 2012)

Za javno financiranje raziskovalnih programov in projektov v Sloveniji sta značilni visoka centralizacija in tekmovalnost. V zadnjih desetih letih načela slovenskega znanstvenega raziskovanja polagajo velik poudarek na povečanje števila izdaj znanstvenih publikacij in tudi njihov vpliv in dolgoročno obstojnost. V letu 2017 je bila Slovenija med članicami Evropske Unije po stopnji rasti števila publikacij in po številu prejetih citiranj na precej visokem mestu.

(Iglič, Doreian, Kronegger, in Ferligoj, 2017, str. 3-4) 2.1.2 Raziskovalni cikel

Raziskovalni cikel, kot ga poznamo v kontekstu raziskovalno-razvojnega procesa, poteka praviloma v štirih fazah.

V prvi fazi pride do odkritja neke nove ideje, spoznanja potencialne resnice o nekem pojavu in postavitvi hipoteze. Za to fazo sta značilna zbiranje in neformalni pregled literature.

V drugi fazi po uspešno formalno recenzirani literaturi ponavadi pride do odobritve in s tem financiranja.

(10)

Tretja faza je namenjena raziskovanju s ciljem potrditi ali ovreči hipotezo, novim uvidom in dosegu boljšega razumevanja preučevanega pojava.

V četrti fazi se pripravi diseminacija rezultatov preko uradne publikacije, na primer članka v znanstveni reviji. (Ware in Mabe, 2015, str. 12)

Znotraj znanstveno-razvojnega cikla je znanstveno objavljanje ključnega pomena za posameznikov karierni obstoj, napredovanje in zagotovitev sredstev. To dejstvo znanstveno raziskovalnega udejanjanja je skozi leta stalno pridobivalo na pomembnosti, do te mere, da je v današnjem času tudi nepoznavalcem dobro poznan izraz »publish or perish« (objavi ali odmri). Tudi pri napredovanju in imenovanju v pozicije profesure znotraj univerzitetnega šolskega sistema, kot diktirajo habilitacijska pravila, se od raziskovalcev pričakuje in spodbuja čim rednejše objavljanje v sklopu znanstvene literature. Izmed te literature je najbolj čislano in spoštovano objavljanje v prestižnih znanstvenih revijah z visokim faktorjem vpliva.

2.1.3 Znanstvena revija

Znanstvena revija je periodična, redno izhajajoča publikacija, v kateri se nahajajo aktualni članki s področja znanosti za tisto obdobje. Tradicionalno izpolnjuje pet funkcij (Ware in Mabe, 2015, str. 16):

 Registracija: avtorji z datumsko zabeleženo objavo registrirajo lastništvo svoje ideje.

 Diseminacija: širjenje in predočenje svojih rezultatov širšemu, ali z izbiro določene znanstvene revije, ciljnemu občestvu.

 Certifikacija: potrditev kvalitete svojih rezultatov preko recenzentske funkcije znanstvenih kolegov.

 Arhiviranje: ohranjanje statične, nespremenljive verzije dokumentacije v obliki znanstvenega članka za bodoče reference in citate.

 Navigacija: znanstvene revije nudijo tudi funkcijo navigacije oz. neke vrste kažipota k relevantnim člankom v poplavi znanstvenih del.

2.1.4 Vrednotenje znanstvenih revij

M. L. Raising je bil prvi scientometrik, ki je predlagal izračunavanje specifičnega faktorja vpliva za ocenjevanje kvalitete znanstvenih revij na osnovi izračunavanja razmerja med številom citatov, ki jih pridobijo članki dane znanstvene revije in številom člankov, ki so objavljeni v tej reviji. Poleg Garfieldovega faktorja vpliva oz. »JCR-impact« faktorja se danes v scientometrični strokovni literaturi najpogosteje omenjata še disciplinarni faktor vpliva in

(11)

»JCS indeks«. (Mali, 1996, str. 9)

Garfieldov faktor vpliva znanstvenih revij, ki je danes v praktični uporabi, temelji na izračunavanju povprečne letne citiranosti vseh člankov, ki so vključeni v dano znanstveno revijo. V okviru vsakoletnega poročila »Journal Citation Report«, ki ga kot dodatek znanstvenemu indeksu citiranosti (SCI) posreduje Inštitut za znanstveno informacijo (ISI), v katerem je vključenih več tisoč znanstvenih revij, se faktor vpliva vključenih znanstvenih revij konstantno izračunava na temelju citiranosti njenih člankov za predhodni dve leti. (Mali, 1996)

Eugene Garfield, eden izmed ustanovnih očetov bibliometrike in scientometrike, navaja naslednje ključne kriterije za vključitev znanstvenih revij v ISI-jevo bazo podatkov (Mali, 1996):

 Pomembnost in vpliv člankov, ki jih objavlja neka revija

 Reference, pridobljene s strani predmetnih specialistov

 Pogostost citiranja

 Predlogi s strani naročnikov

 Zgodovinski podatki

 Uredniška politika

 Geopolitični vidiki

 Točnost

Velikost vrednosti faktorja vpliva znanstvenih revij variira ne samo med znanstvenimi vedami in disciplinami, temveč celo - in to zelo izrazito - tudi znotraj posameznih poddisciplin, saj različne kognitivne strukture vodijo k različnim praksam citiranja. Razen tega so razlike v vrednostih faktorjev vpliva znanstvenih revij pogojene s povsem "tehničnimi" razlogi v metodologiji spremljanja citiranosti znanstvenih revij. Socio-kognitivne značilnosti posameznih znanosti pomembno opredeljujejo njihov publicistični ustroj. Zato po vsej verjetnosti vedno ista uporaba kriterijev kvalitete znanstvenega dela ni primerna in terja boljši razmislek. (Mali, 1996, str. 10)

2.1.5 Razlike v raziskovanju in objavljanju

Ko se ozremo po pretekli literaturi, ki se je ukvarjala z vprašanjem o morebitnih razlikah, ki se kažejo pri raziskovanju in objavljanju tekom znanstveno-razvojnega procesa, lahko brž spoznamo, da so razlike očitne in da jih ni malo.

(12)

Klaus Jaffe je s prilagojenim numeričnim modelom, razvitim v Fortranu z namenom proučevanja optimalnih strategij zbiranja surovin pri mravljah v različnih okoljih, ugotovil, da se v kontekstu raziskovanja različnih virtualnih področij znanja pokažeta dve razhajajoči se, optimalni strategiji.

Njegov model je pokazal, da se raziskovalne strategije znotraj naravoslovnih znanosti rade prilagodijo področjem z velikimi, koncentriranimi skupinami znanja (knowledge clusters), medtem ko se raziskovalne strategije znotraj družboslovnih znanosti orientirajo k področjem z veliko malimi, bolj osamljenimi skupinami znanja.

Za naravoslovno znanost so značilne raziskovalne strategije s fokusom na nekaj velikih, koncentriranih skupin znanja, kjer je »sledenje« veliko bolj pomembno kot izvirno, novo raziskovanje. To ima za posledico, da majhno število znanstvenih revij objavlja mnogo del.

(Jaffe, 2014)

Na drugi strani pa se raziskovalne strategije v družboslovnih znanostih optimizirajo pri delovanju v veliko majhnih, izoliranih skupinah znanja, kjer je sledenje sekudarnega pomena, in je sveže odkrivanje izvirnega znanja veliko bolj pomembno. To ima predvidljivo za posledico, da je v družboslovju veliko različnih znanstvenih revij, vsaka z relativno majhnim številom izvirnih člankov. (Jaffe, 2014)

Scientometrične analize, kot so študije A.F.J. van Ranna in A.J. Nederhofa, so pokazale, da obstajajo izrazite razlike glede tipa strokovne literature, v kateri raziskovalci iz obeh vrst znanosti objavljajo. Rezultati so namreč pokazali, da kar 70 % vseh informacij znotraj naravoslovnih znanosti odpade na znanstvene revije, medtem ko pri družboslovnih znanostih prednjačijo knjige, monografije, strokovna poročila, ekspertize in ostali tipi sive literature kot pomembnejši kanali diseminacije znanstvenih rezultatov. (Mali, 1996, str. 8)

Z leti se sicer ta razlika manjša zaradi vedno večje vloge in prestiža, ki jo nosi objavljanje v znanstvenih revijah z visokim faktorjem vpliva, tudi pri družboslovju in humanistiki.

Poročilo JISC (Joint Information Systems Committee) leta 2005 na temo disciplinarnih razlik z ozirom na znanstvene članke je pokazalo na dodatna zanimiva odstopanja pri objavljanju, branju in uporabi le-teh. Ugotovili so, da je pri tako imenovanih »trdih znanostih«, kot so biomedicina in fizika, faktor števila objavljenih člankov za triletno obdobje 7,5, pri družboslovnih znanostih 5, pri umetnosti in humanistiki pa manj kot 3. (Ware in Mabe, 2015, str. 55-60)

(13)

Nadalje, v povprečju znanstvena revija objavi približno 120 člankov na leto, od tega je 25 naravoslovnih revij s približno 140 članki letno, družboslovne revije pa povprečno premorejo zgolj 45 člankov letno. S to informacijo se lahko tudi uspešno razlaga, zakaj so revije iz naravoslovja ponavadi dražje od družboslovnih. (Ware in Mabe, 2015)

Razike so se pokazale tudi v dobi najvišje relevantnosti spisanega članka, oz. v letih, od kar so bili najbolj relevantni članki v določeni disciplini objavljeni. Za družboslovje so to bili članki spisani pred 20 leti, v kemiji, strojništvu in medicini pred 10 leti, v informatiki in računalniških vedah pa pred 5 leti. (Ware in Mabe, 2015)

Avtorji so izpostavili tudi značilne razlike v branju in iskanju znanstvenih člankov med disciplinami. Na primer, raziskovalci, ki delujejo v medicini, so praviloma prebrali kar skoraj trikrat več člankov kot njihovi kolegi iz družboslovja.

Zadnja razlika, ki jo velja omeniti, pa zadeva odnose avtorjev v različnih disciplinah do strokovnega medsebojnega pregleda (peer review). Na splošno rečeno so bili avtorji znotraj naravoslovnih znanosti v večji meri mnenja, da strokovni medsebojni pregled služi svojemu namenu kot pa avtorji znotraj družboslovnih znanosti. (Ware in Mabe, 2015)

Toliko o razlikah prej omenjenega poročila, katerega avtorji so mnenja, da so omenjene razlike aplikativne na svetovni znanstveni prostor in se odražajo tudi izven Združenega kraljestva, kjer je bila analiza izvedena.

Kaj pa razlike v slovenskem znanstvenem prostoru? O tem je izčrpno pisal že dr. Franc Mali v svoji Bibliometrični analizi raziskovalnih rezultatov znanstvenikov v Sloveniji. (Mali, 1996) V svoji študiji je sicer operiral z večimi področji znanosti, ne zgolj z naravoslovjem in družboslovjem, vendar pa se tudi tu kažejo predvidljive razlike, skladne s prej omenjenimi razlikami.

Ugotovitve so bile naslednje (Mali, 1996, str. 7-8):

 Z najvišjim deležem objav v znanstvenih revijah znotraj svojega celotnega publicističnega izplena se ponaša naravoslovje. (34,4 %)

 Pri objavah v znanstvenih knjigah in sestavkih v znanstvenih knjigah prednjači družboslovje (13,7 %)

 Največ člankov v strokovnih revijah pride iz humanistike. (22,3 %)

(14)

 Največ strokovnih knjig in sestavkov v strokovnih knjigah se napiše v humanistiki (15,5 %)

 Pri prijavljenih in podeljenih patentih predvidljivo vodi tehnika, kljub nizkemu absolutnemu deležu znanstvenega izdatka (1,5 %)

PHARE-jeva študija o razvoju znanosti in tehnologije na Slovenskem pa je že dve leti pred tem ugotovila, da pri naših raziskovalcih vseh znanstvenih profilov, z izjemo humanistike, prevladuje objavljanje v zbornikih znanstvenih konferenc. (Mali, 1996)

S tem védenjem o razlikah v deležih različnih tipov publicističnih enot znotraj posameznih ved, lahko v dobri veri izvajamo zaključke o različnih publicističnih habitusih raziskovalcev znotraj posameznih znanstvenih ved in predpostavljamo o razlikah v prolifičnosti avtorjev skozi čas. Vendar pa se je pred tem vredno ozreti še po morebitnih razlikah pri sodelovanju, sami geografski lokaciji delovanja in družbeno-razvojnih ciljih.

2.1.6 Razlike v sodelovanju

Znanost je v času šla skozi tranzicijo v načinu produkcije znanja (iz »modusa 1« v »modus 2«), kjer so se pričele formirati multi, inter, ter transdisciplinarne ekipe raziskovalcev, z namenom skupnega sodelovanja pri reševanju konkretnih, življenjskih problemov. (Gibbons et al. 1994) Nedavni preskok iz »industrijske družbe« v »družbo znanja« pa namiguje na pojačan triadni kooperativni odnos med akademiko, industrijo in vlado, poznan pod nazivom

»teza treh vijačnic« (triple helix thesis). (Etzkowitz in Leydesdorff 1995, 2000)

Kadar si želijo raziskovalci zagotoviti sredstva za izvedbo obširnih in celovitih znanstvenih projektov, se praviloma obrnejo na svoje kolege v ostalih domačih, akademskih in neakademskih ustanovah, kjer ima slednje še posebej velik pomen. (Iglič in drugi, 2017, str.

16)

Zanimivo je, vsaj tako se zdi, da so akademske strukture nagrajevanja ustrojene na način, da spodbujajo monodisciplinarno raziskovanje, saj monodisciplinarni članki prejmejo načeloma večje število citiranj kot interdisciplinarni članki. (Levitt in Thelwall, 2008) Za raziskovalce, delujoče v majhnih znanstvenih sistemih, pa je sodelovanje z mednarodnimi akademskimi partnerji še posebej dobrodošlo, kadar so njihovi članki objavljeni v prestižnejših revijah in prejmejo več citiranj. (Kyvik in Larsen, 1997)

Kronegger ugotavlja, da je število večavtorskih publikacij v Sloveniji v vseh štirih

(15)

proučevanih disciplinah (matematika, fizika, biotehnologija, sociologija) raslo veliko hitreje kot število monoavtorskih publikacij. V obdobju med letoma 1986 in 2005 je število monoavtorskih publikacij s področja sociologije tako upadlo s 70 % na 30 %, v matematiki s 65 % na 30 %, v fiziki s 16 % na 11 %, in v biotehnologiji s 17 % na zgolj 4 %. (Kronegger, 2011)

To priča o jasnem trendu in izrednem pomenu sodelovanja v znanstveno razvojnem ciklu, zato je še kako vredno pogledati in izpostaviti morebitne razlike, ki se kažejo v primerjavi med različnimi vedami, saj lahko te nosijo pomembne posledice za celotni raziskovalni proces in nam nudijo vredne uvide v prihodnost. Kaj govorijo torej podatki o znanstvenem sodelovanju?

Če za trenutek, preden se posvetimo sodelovanju v Sloveniji, pogledamo sodelovanje drugod in se zopet ozremo k prej omenjeni študiji disciplinarnih razlik v Združenem kraljestvu (Mabe in Mulligan, 2011), lahko brž opazimo očitne razlike. Tam so namreč poročali, da so raziskovalci v naravoslovnih znanostih sodelovali veliko pogosteje kot raziskovalci družboslovnih znanosti. Konkretno, kar 85 % respondentov s področja biomedicine je poročalo, da je 75 % ali več njihove znanstvene produkcije plod sodelovanja, za njimi so se uvrstili raziskovalci fizikalnih znanosti in strojništva, na samem koncu pa avtorji družboslovnih znanosti, od katerih jih je 76 % poročalo, da je bera njihovih kolaborativnih del zgolj 25 %. (Ware in Mabe, 2015)

Tudi bibliometrična analiza Katarine Prpič (Prpič, 1994) o povprečni znanstveni produktivnosti hrvaških raziskovalcev v obdobju med letoma 1985 in 1989 dokazuje obstoj velikih razlik med vedami glede pogostosti pojavljanja večavtorskih publikacij. Rezultati so pokazali, da je večavtorstvo prevladujoč tip publiciranja v naravoslovju, nato tehniki in medicini, pri biotehniki je bilo razmerje med večavtorstvom in monoavtorstvom bolj uravnoteženo, povsem drugačna slika pa je bila na področju družboslovja in humanistike, kjer je v celoti prevladovalo monoavtorstvo. (Mali, 1996, str. 4)

Podatki o znanstvenem sodelovanju raziskovalcev v Sloveniji nam sliko še jasneje zarišejo.

Za konkretne razlike se lahko ponovno ozremo k bibliometrični analizi raziskovalnih rezultatov znanstvenikov v Sloveniji dr. Franca Malija. Ugotovitve so bile sledeče:

 Več-avtorstvo publicističnih enot močno prevladuje v znanstvenih disciplinah s področja t.i. »trde znanosti«.

(16)

 Pri 14 % projektov s področja naravoslovja, 13,9 % s področja tehnike, 15,8 % s področja biotehnike se celotna publicistična bera porazdeli na 5 ali manj avtorjev.

 Pri družboslovju je ta delež 51 %, pri humanistiki 55,7 %

 V 36,4 % projektov s področja naravoslovja, 22,7 % s področja tehnike in 31,4 % s področja biotehnike pri avtorstvu nastopa več kot 25 ljudi

 Na področju družboslovja zgoraj omenjenih projektov ni, na področju humanistike pa jih je borih 3,8 %. (Mali, 1996)

V družboslovnih vedah razmerje monoavtorskih izdaj preseže razmerje vsote vseh različnih vrst večavtorskih izdaj, kar označuje družboslovje kot najmanj kolaborativno področje v znanosti. (Kronegger in drugi, 2014, str. 7)

Dva podatka, ki se kažeta kot zanimiva z vidika posledic za znanstveno sodelovanje in s tem celotni raziskovalno-razvojni cikel v prihodnosti, pričata o tem, da so ženske precej manj vpletene v mednarodno sodelovanje kot moški ter da so raziskovalci v mednarodno sodelovanje najbolj aktivno vpleteni nekje med desetim in petindvajsetim letom svoje raziskovalne kariere. (Iglič in drugi, 2017) Tu se odpira več vprašanj kot odgovorov in ta diskrepanca se zdi zrela za nadaljnje raziskovanje.

Jasno je torej, da obstaja velika vrzel v stopnjah sodelovanja pri naravoslovnih znanostih na eni in družboslovnih na drugi strani (Kronegger in drugi, 2014), vendar pa je vredno dodati še pomembno opazko, da kultura in struktura sodelovanja nista nujno neposredno odvisni od delitve disciplin kot take, ampak od oblike raziskovalnega procesa in organizacije dela (laboratorijsko/pisarniško). (Kronegger, 2011, str. 186)

2.1.7 Objavljanje doma ali v tujini

Zaradi specifičnosti obravnavane problematike se bom na tej točki osredotočil na razlike pri objavljanju doma oziroma v tujini med različnimi vedami zgolj z vidika slovenskih raziskovalcev, čeprav bi bilo zanimivo videti, kako različni geografski in socioekonomski dejavniki, lastni ostalim državam sveta, vplivajo na zabeležene trende.

Pri slovenskem znanstvenem delovanju se v vseh vedah objavlja več doma kot pa v tujini.

Najbolj uravnoteženo razmerje je v naravoslovju, z 51 % del objavljenih doma, in 49 % v tujini.

V tehniki in humanistiki je ta razlika največja, s kar 80 % del objavljenih doma, 20 % pa v

(17)

tujini. Z visokim deležem domačih objav (75 % doma, 25 % tujina) sledi biotehnika, pri družboslovju pa je to razmerje 67 % proti 33 % v prid domačim objavam. (Mali, 1996, str. 9) Že večkrat omenjena bibliometrična raziskava raziskovalnih rezultatov znanstvenikov v Sloveniji je pokazala, da pri nas 7 % projektnih skupin s področja naravoslovja še nima objavljenih člankov v tujih znanstvenih revijah. Ti deleži so bili pri tehniki 20,7 %, biotehniki 23,7 %, družboslovju 34,7 % in humanistiki 38,5 %. Kadar pa je bil pri znanstvenih revijah upoštevan še faktor vpliva, so bile te razlike še večje. (Mali, 1996, str. 11)

Kot Mali zaključi, sta pri svojem vplivu na mednarodno znanstveno skupnost najbolj prikrajšani vedi družboslovja in humanistike. Bilo bi vredno razmisliti, v kolikšni meri k temu prispevajo družbeno-kulturni in kognitivni dejavniki razvoja teh znanosti. (Mali, 1996, str.

12)

2.1.8 Razlike v družbeno-razvojnih ciljih

Pri vprašanju družbeno-razvojnih ciljev avtorjev znotraj posameznih ved se kaže več podobnosti kot razlik.

V svetovnem merilu namreč vsi avtorji, ne glede na disciplino, kot razlog za objavljanje v znanstvenih revijah postavljajo na prvi dve mesti karierno napredovanje in strokovni medsebojni pregled (peer to peer communication). (Ware in Mabe, 2015, str. 57)

Jedrne potrebe raziskovalcev v odnosu do znanstvene komunikacije z vidika vloge avtorja so bile konkretno:

 Biti opažen kot prvi poročevalec neke nove ideje

 Prepričati bralca, da so njihovi rezultati splošni in plod kanonične, znanstvene metode

 Imeti svoje rezultate preverjene in odobrene s strani svojih strokovnih kolegov (peer review)

 Poročati svoje ideje pravemu, ciljnemu občestvu

 Pridobiti prepoznanje za svoje ideje

 Pridobiti stalen, javno dokumentiran zapis svojega dela

Četrta izdaja reportaže STM, objavljena marca 2015, ki jo izdaja Mednarodno društvo znanstvenih, tehniških in zdravstvenih založnikov, je kot glavno vodilo pri objavljanju navedlo »diseminacijo rezultatov« s kar 73 %, takoj za tem pa »karierno napredovanje« in

»zagotovitev sredstev« kot sekundarna motivatorja. Ti rezultati so bili skladni z rezultati

(18)

predhodne študije iz leta 1993, značilno pa se je od takrat pri avtorjih povečala pomembnost sekundarnih motivatorjev »prepoznanja« in »postavitve zgleda« s svojim delom. (Ware in Mabe, 2015, str. 70)

Tudi v slovenskem znanstvenem prostoru so avtorji počez, z izjemo zgolj družboslovja, navedli kot glavni družbeno-razvojni cilj splošno širjenje znanja. Družboslovci so na prvo mesto postavili nacionalni razvoj. Tako dr. Mali ocenjuje, da vede, ki pokrivajo področje trdih znanosti, kot so naravoslovje, fizika, tehnika in biotehnika, na prvo mesto postavljajo razvoj aplikativnega raziskovanja, družboslovje in humanistika pa tu vidita razvoj svojih temeljnih raziskovanj. (Mali, 1996, str. 5)

2.1.9 Karierne poti po spolu in disciplini

»Trenutni status žensk v znanosti je kombinacija odločnega napredovanja in neizpolnjenih obljub.« (Sonnert in Holton, 1996, str. 63)

V študiji National Science Foundation Report o ženskah, manjšinah in osebah z omejitvami v znanosti, so rezultati pokazali, da so pri praktično vseh obravnavanih spremenljivkah študije ženske na slabšem položaju od moških. Obstajata dva vidika, ki poskušata pojasniti takšno stanje – primankljajni model (deficit model) in model razlike (difference model). (Sonnert in Holton, 1996, str. 63)

Primanjkljajni model je osnovan na strukturnih razlagah znanstvenih karier. Domneva namreč, da obstajajo mehanizmi formalnega in neformalnega izločanja žensk v znanostih preko pravnih, političnih, družbenih in strukturnih ovir. Ženske kot skupina naj bi bile potemtakem deležne manj priložnosti tekom svojih kariernih poti, kar se kaže v slabšem kariernem izkupičku.

Model razlike pa govori o obstoju globoko vpetih razlik v obnašanju, perspektivi in ciljih med moškimi in ženskami. Po tem modelu tičijo razlogi za razlike med spoloma z ozirom na karierno uspešnost v posameznikih samih oziroma že v sami razliki med spoloma. Te razlike so lahko prirojene, ali pa rezultat socializacije in kulturoloških vzorcev, in naj bi oblikovale tako posameznike kot tudi karakter družbenih ustanov. (Sonnert in Holton, 1996, str. 63) Ta dva vidika pa nista izključujoča, ampak se pogosto dopolnjujeta. O tem priča model »brce in reakcije« (kick-reaction model), ki sta ga razvila Jonathan R. Cole in Burton Singer. Ta model govori o tem, da je oseba tekom svoje karierne poti izpostavljena mnogim pozitivnim

(19)

ali negativnim »brcam« s strani svojega okolja, katerim pa nato sledijo posameznikove reakcije. Znotraj tega modela se z brcami povezujejo prepreke iz primanjkljajnega modela, z reakcijami pa prepreke iz modela razlike. (Sonnert in Holton, 1996, str. 63)

Velja biti pozoren na te interakcije med strukturnimi ovirami in vedenjsko-odnosnimi ovirami, saj se zdi, da z njimi veliko bolje pojasnimo diskrepance med spoloma, kot pa s teorijo enega dramatičnega dogodka (npr. rojstvo otroka). Poleg tega nas opozarja, da gre za sistemski problem počasnega kopičenja majhnih nepravičnosti in pomanjkljivosti, ki se akumulirajo in vodijo v veliko nepravičnost, skladno z Robert K. Mertonovim konceptom o kopičenju prednosti in pomankljivosti. (Sonnert in Holton, 1996, str. 63)

O teh pomanjkljivostih in njihovih posledicah jasno pričajo naslednji rezultati študije:

 Ženske praviloma za »prestižno pripadnost« plačajo s primanjkljaji v položaju, medtem ko moški ne

 Razmerje upada (razmerje bivših sodelavcev in sodelavk, ki ne delujejo več v znanosti) je pri ženskah večje kot pri moških (10.5 % proti 8.5 %)

 Z izjemo biologije so ženske v znanostih, kot so fizika, matematika, in strojništvo, v nižjem kariernem položaju kot moški

 Kar zadeva diskriminacijo. je kar 72.8 % žensk izrazilo, da so bile podvržene diskriminaciji, medtem ko je 12.9 % moških priznalo, da so bili deležni pozitivne diskriminacije

 Ženske v primerjavi z moškimi v povprečju izkusijo manj znanstvenega sodelovanja kot enakopraven ali izkušenejši partner (senior), in več kot neizkušen partner (junior)

 Ženske so v povprečju manj prepričane v svoje sposobnosti pri znanstvenem delu kot moški

 Več kot trikrat več žensk kot moških (15.9 % proti 4.4 %) je imelo nejasne karierne želje, ko so se podale na znanstveno pot

 Tako partnerski staž kot starševstvo nista značilno vplivala na karierne izide tako pri moških kot pri ženskah

Tudi študiji Sonnerta (Sonnert, 1995) in Longa (Long, 1992) kažeta na v povprečju veliko večjo citiranost člankov, katerih avtorica je ženska, kot pa člankov, katerih avtor je moški.

Takšni rezultati podpirajo teorijo, da ženske stremijo k bolj kvalitativnemu delu kot moški in da posledično težje napredujejo v zelo kvantitativno naklonjenem znanstvenem prostoru.

(Sonnert in Holton, 1996, str. 69)

(20)

Kaj pa govorijo podatki o premikanju kariernih poti po disciplinah? Pretekle študije (Cresswell in Bean, 1981; McLaughlin, Montgomery in Malpass, 1975; Smart, 1976) so že namigovale, da je karierno premikanje znanstvenih raziskovalcev odvisno od disciplin, v katerih delujejo (Carroll, 1991, str. 670)

Carrollova študija nam postreže z naslednjimi uvidi:

 Raziskovalci t.i. »mehkih disciplin« (družboslovje) so pri vsakem stadiju svoje kariere praviloma starejši kot njihovi kolegi iz t.i. »trdih disciplin« (naravoslovje) (Carroll, 1991, str. 672)

 Raziskovalci iz »mehkih disciplin« praviloma porabijo več časa med magistrsko nalogo in doktoratom (5,3 leta) kot raziskovalci iz »trdih disciplin« (3,53 leta) (Carroll, 1991, str. 672)

 Raziskovalci v »trdih disciplinah« so načeloma deležni daljših profesur (6,98 leta), kot tisti iz »mehkih disciplin« (5,85 leta) (Carroll, 1991, str. 677)

 Raziskovalci »trdih disciplin« so se po prekinitvi manj verjetno (59,93 %) vračali k fakultativnim dejavnostim za polni čas, kot njihovi kolegi iz »mehkih disciplin«

(70,60 %) (Carroll, 1991, str. 678)

 Če primerjamo discipline gleda na aplikativnost, se pokaže, da so raziskovalci v t.i.

»aplikativnih disciplinah« praviloma starejši od svojih kolegov iz t.i. »čistih« oz.

teoretskih disciplin, za vse stadije kariernega napredovanja (Carroll, 1991, str. 673)

 V »aplikativnih disciplinah« v povprečju raziskovalci porabijo 5,05 leta med magistrom in doktoratom, v »čistih« oz. teoretskih disciplinah pa 3,71 leta (Carroll, 1991, str. 673)

 Raziskovalci »aplikativnih disciplin« veliko pogosteje zapustijo akademsko okolje in nadaljujejo svojo karierno pot zunaj fakultete (Carroll, 1991, str. 678)

 Oddelki znotraj »čistih« oz. teoretskih disciplin so načeloma večji od oddelkov znotraj

»aplikativnih disciplin« (Carroll, 1991, str. 681)

 Oddelki znotraj »čistih« oz. teoretskih disciplin imajo večje razmerje raziskovalcev s profesuro kot oddelki znotraj »aplikativnih disciplin« (faktor 5,53 proti 3,87) (Carroll, 1991, str. 682)

Opremljen s poznavanjem vseh teh razlik ki, se kažejo v mnogoteri dimenziji raziskovalno- razvojnega procesa lahko v nadaljevanju preudarno postavim domneve o morebitnih razlikah v odnosu do vzorcev objavljanja slovenskih avtorjev skozi čas.

(21)

2.2 Hipoteze

Hipoteza 1: Obstajajo različni profili znanstvenega objavljanja slovenskih raziskovalcev Hipoteza 2: Obstajajo razlike v profilih objavljanja slovenskih raziskovalcev med naravoslovjem in družboslovjem

Hipoteza 3: Spol je s svojimi večplastnimi družbeno-socialnimi konotacijami dejavnik, ki izrazito vpliva na razlike v načinih objavljanja in determinira določen profil znanstvenega objavljanja.

2.3 Merjenje

Dinamika objav posameznega raziskovalca, merjena kot število objavljenih znanstvenih prispevkov v koledarskem letu, je predstavljena s profili posameznikov. En profil v analizi simbolnih podatkov predstavlja eno enoto.

Simbolni podatki so podatki, ki nosijo večjo intrinzično kompleksnost zavoljo svoje notranje variacije in strukture. Zaradi svoje lastne interne strukture, ki ni niti pojavna niti mogoča znotraj klasičnih podatkov, simbolni podatki kličejo po drugačni vrsti analize – analizi simbolnih podatkov. (Billard in Diday, 2003)

Simbolni podatki nastanejo iz več različnih virov oziroma zaradi različnih razlogov. Tako lahko tiči njihov izvor na primer v seštevanju ogromnih relacijskih podatkovnih baz.

Ker so baze podatkov čedalje večje in obširnejše, jih je potrebno na nek način združiti.

Namreč tako, da lahko analitiki z njimi lažje in hitreje manipulirajo in da novo ustvarjena baza še vedno dobro odraža informacije oziroma znanje svojih matičnih baz. Ena izmed posledic takšnega združevanja je, da podatki znotraj baze ne morejo biti več zapisani z enoznačnimi vrednostmi, kot je to praksa za klasične podatke, ampak morajo biti predstavljeni z intervali, distribucijami, seznami in podobnim. Tem novo ustvarjenim,

»seštetim« podatkom pravimo simbolni podatki. (Billard in Diday, 2003) Čeprav seštevanje velikih podatkovnih baz se odraža v manjših bazah simbolnih podatkov, pa so simbolni podatki po svoji naravi distinktivni in se ločijo od običajnih podatkov, ne glede na velikost baze. (Billard in Diday, 2003)

Simbolni podatki lahko nastanejo tudi kot posledica stroke oz. strokovnega znanja (vrste insektov, tipi emigracij, etc...), iz verjetnostne porazdelitve, iz časovnih vrst (pri opisovanju

(22)

časovnih vrst s histogrami), iz zaupnih podatkov (prikrivanje izvirnih podatkov preko manjše natančnosti), etc. (Diday in Esposito, 2003)

Če torej potegnemo ločnico med klasičnimi podatki in simbolnimi podatki, lahko ugotovimo:

Za klasične podatke drži pravilo, da za vsako enoto xij v množici X obstaja natanko ena sama možna vrednost. Na primer: posameznik Y ima prvo spremenljivko starost, ki nosi vrednost 31, drugo spremenljivko mesto, ki nosi vrednost »Ljubljana«, tretjo spremenljivko poklic, ki nosi vrednost »Programer«, in tako dalje. Tako lahko rečemo, da je klasična podatkovna točka zgolj enoznačna točka v p-dimenzionalnem prostoru X. (Billard in Diday, 2003)

Na drugi strani pa lahko simbolna podatkovna točka predstavlja »hiperkocko« v p- dimenzionalnem prostoru oz. kartezijski produkt distribucij. (Billard in Diday, 2003) Vnosi v simbolnih podatkovnih setih niso omejeni na enoznačne specifične vrednosti. Tako je lahko spremenljivka, kot je na primer starost, predstavljena z intervali. To se lahko zgodi na primer, kadar spremenljivka starost predstavlja starost bodisi družine ali neke skupine, katere posamezniki oz. njihove individualne starosti padejo znotraj nekega intervala, na primer 20 do 30 let. Ali pa, kadar gre za posameznika, čigar točna starost je neznana, vendar vemo, da se giblje znotraj nekega intervala. Nekatere spremenljivke pa je enostavno nemogoče izmeriti natančno z eno samo nespremenljivo vrednostjo. Primer takšne spremenljivke bi bil srčni utrip, kjer ne bi bilo prav govoriti o enoznačni vrednosti, recimo 64, ampak o vrednosti in njenem standardnem odklonu, 64+-2. (Billard in Diday, 2003)

Najpogosteje poznamo tri vrste simbolnih spremenljivk:

 Intervalne: srčni utrip (64+-2), teža (med 75 in 80 kg). Interval je lahko odprt ali zaprt.

(Billard, 2006)

 Večvrednostne: spremenljivka Yj predstavlja tip avtomobila v nekem gospodinjstvu.

Vrednost je tako lahko (Toyota, Volvo), ker sta v gospodinjstvu dva avtomobila.

Natančneje, seznam večvrednostnih simbolnih naključnih spremenljivk Y je takšen, katerega možne vrednosti zavzamejo eno ali več vrednosti iz seznama vrednosti v njegovi domeni Y. Končni list vseh možnih vrednosti v Y je lahko končen ali neskončen, njegove vrednosti pa so lahko natančno določene kategorične ali kvantitativne vrednosti. (Billard, 2006)

 Modalne: to so spremenljivke z večimi stanji, s frekvenco, verjetnostjo ali utežjo, ki pritiče vsaki posamezni vrednosti v podatkih. Na primer, če ima posameznik 4 brate, izmed katerih so trije diabetiki, eden pa ne, potem bi lahko spremenljivka ki opisuje

(23)

posameznikovo nagnjenost k diabetesu, zavzela vrednost Eij={3/4 diabetes, 1/4 nondiabetes} (Billard in Diday, 2003)

Če povzamemo: za razliko od klasičnih podatkov, pri katerih se posamezna podatkovna točka sestoji iz ene same enoznačne kategorične ali kvantitativne vrednosti, imajo simbolni podatki notranjo variabilnost in so lahko strukturirani. Natanko prisotnost te variabilnosti pa je razlog, da klasične analitične metode ne zadostijo našim potrebam in da simbolni podatki kličejo po novih, drugačnih tehnikah podatkovne analize. (Billard in Diday, 2003)

2.4 Metoda

Človeka že od nekdaj žene neka notranja, neomajna gonilna sila po razumevanju svoje okolice. Eden izmed najbolj vplivnih in spoštovanih mislecev razsvetljenstva, angleški filozof in fizik John Locke je v svoji drugi knjigi z naslovom »An essay concerning human understanding« (esej o človekovem razumevanju) razdelal koncept najbolj osnovne enote človekovega znanja oz. vedenja. Po Locku je najosnovnejši gradnik vedenja ideja, ki se rodi skozi izkušnjo, bodisi kot posledica njegove interakcije z zunanjim svetom preko petih čutnih zaznav, bodisi kot posledica introspekcije, kadar prepozna ideje o svojih lastnih funkcijah kot so razmišljanje, hotenje, vera in skepsa. Vendar pa so ideje o stvarni realnosti naravnega sveta in njegovih modalnostih, kot zgolj derivati naših izkušenj, nezadostne. Na to nas je opomnil že Descartes v svojih Meditacijah, še pred njim pa Platon in Aristotel z vzpostavitvijo »form«

v naravnem svetu kot osnovnih principov o stvareh, spoznavnih preko prevpraševanja. Prav slednji je bil tisti, ki je v svoji razpravi naslovljeni Analytica Posteriora (posteriorna analitika) kot izhodiščno točko znanstvenega uvida postavil ne zgolj empirizem in pozorno obravnavo, ampak tudi ustrezno razvrščanje, prikaz, in način empiričnega odkrivanja. Za Aristotla je znanost (epistêmê) korpus pravilno urejenega znanja in učenja (Andersen in Hepburn, 2015).

Natanko ta distinkcija oziroma prizadevanja po ustreznem odkrivanju, razvrščanju in prezentaciji so tisto, kar v veliki meri določa metode uspešnega znanstvenega raziskovanja.

Poleg tega pa je determinantna tudi sama narava znanja, ki ga iščemo. Tako, če povzamem, znanstvena metoda zahteva poleg pozornega in ustreznega opazovanja tudi logični sistem sklepanja za ne samo pravilno razvrščanje znanja, ampak – kar je ključno – za sklepanje onkraj tistega, kar je v danem trenutku spoznavno. To zajema vrsto metod, od indukcije, analogije, napovedi itd. (Andersen in Hepburn, 2015) Eno od področij, ki se je skozi zgodovino izoblikovalo kot najbolj ustrezno v domeni znanstvene metode, je statistika.

Če se zazremo nazaj skozi zgodovino statistike in za trenutek obstanemo na zgodnjih

(24)

obstoječih metodah analize simbolnih podatkov, nam hitro postane jasno, da so se le-te močno napajale iz analogij v obdobju razvoja pred letom 1900, ko so bili ustvarjeni temelji inferenčne statistike in so bile metode povečini krojene manjšim podatkovnim tabelam in klasičnim, konvencionalnim podatkovnim strukturam. Bornost in nezadostnost teh obstoječih metod sta bila jasna znanilca nujnih sprememb ter glasna klicatelja po razvoju obširnega kataloga novih simbolnih metodologij, skupaj z rigorozno in neizprosno matematično ter statistično osnovo metodologij. (Billard in Diday, 2003)

V zadnjih letih je znaten tehnološki napredek in naglo povečanje procesnih zmogljivosti v sferi informacijske tehnologije omogočilo shranjevanje in obdelovanje vse večjih in vselej rastočih podatkovnih baz. Ta sprememba je med drugim predočila tudi potrebo po razširitvi standardnih metod podatkovne analize na simbolne podatke, z namenom pridobitve novega znanja in uvidov, ki so dotlej tičali skriti globoko v podatkih. Ta potreba je pripeljala do povsem nove metodologije, imenovane »analiza simbolnih podatkov«, katere cilj je natanko to – obstoječe metode klasične analize podatkov, kot so na primer razvrščanje v skupine, faktorska analiza, ter diskriminantna analiza, razširiti na povsem nov tip podatkovnih tabel, imenovan »simbolne podatkovne tabele« in tako podati bolj jasne in razumljive rezultate, izražene z realnimi, stvarnimi koncepti, ter matematično predstavljenimi v obliki lahko berljivih »simbolnih objektov«. (Diday in Esposito, 2003)

Simbolno analizo podatkov lahko tako definiramo kot podaljšek standardne analize podatkov, kjer kot vhodni podatki (input) vstopajo simbolne podatkovne tabele, kot izhodni (output) pa izstopajo novo dobljeni simbolni objekti. (Diday in Esposito, 2003)

Vsaka simbolna analiza podatkov je osnovana na principu štirih področij. To so (Diday in Esposito, 2003):

 Področje posameznikov

 Področje konceptov

 Področje opisov, ki predstavljajo posameznike ali razrede posameznikov

 Področje simbolnih objektov, ki predstavljajo koncepte

Večina algoritmov simbolne analize podatkov v svojih izhodnih podatkih preko procesa generalizacije oz. posplošenja podajajo simbolni opis »d« nekega razreda posameznikov. S tem opisom simbolni objekti modelirajo osnovne, globlje ležeče koncepte in tako prožijo način, kako najti posameznike tega razreda. (Diday in Esposito, 2003)

(25)

V svojem primeru sem kot najprimernejšo metodo za dosego željenega cilja ocenil metodo razvrščanja v skupine. V najširšem pomenu je razvrščanje v skupine proces abstrakcije poimenovanja skupin objektov, za katere menimo, da so na nek način podobni med seboj (Ferligoj, 1989). Oziroma natančneje, cilj je klasificirati objekte v skupine tako, da so te skupine interno čim bolj homogene, hkrati pa eksterno čim bolj različne med seboj (Billard in Diday, 2003).

Pri razvrščanju v skupine lahko večino metod razvrstimo v tri glavne kategorije: hierarhične, nehierarhične in geometrijske metode. Obstaja sicer še četrta kategorija, kamor padejo vse ostale metode, ki se ne znajdejo pod okriljem prvih treh (npr. Wishartova metoda modusov, grafovske metode, etc.) (Ferligoj, 1989), vendar tem ne bom namenjal pretirane pozornosti.

Malce več razlage pa terjata prvi dve skupini, hierarhičnih in nehierarhičnih metod.

Hierarhične metode so verjetno najpogosteje uporabljene metode razvrščanja v skupine.

Delijo se na metode združevanja in cepitve. Prve (in pogosteje uporabljane) v vsakem koraku iteracije dve ali več skupin združijo v novo skupino, druge pa v vsakem koraku iteracije določeno skupino razcepljajo na dve ali več skupin. Prva prednost hierarhičnih metod je, da od uporabnika ne zahtevajo, da definira razpon rezultata. Z drugimi besedami, uporabnik ne določi končnega števila skupin ki bodo nastale kot rezultat združevanja ali cepljenja. Druga prednost pa je, da je rezultat hierarhičnega združevanja ali cepljenja mogoče zelo nazorno grafično predstaviti z drevesom združevanja oz. dendrogramom (Ferligoj, 1989).

Najbolj razločevalna lastnost nehierarhičnih metod od hierarhičnih pa je natanko to, da je pri njih potrebno vnaprej podati število skupin iskane razvrstitve. Te metode razvrščajo enote na način, da skozi iteracije z izbranim optimizacijskim kriterijem - na primer z Wardovim kriterijem minimizacije vsote kvadratov razdalj – izboljšujejo vnaprej podano začetno razvrstitev. To se iterativno nadaljuje, dokler nobena prestavitev enote več ne izboljša kriterijske funkcije. Ker pa te metode v splošnem dajo le lokalno optimalne razvrstitve, je priporočljiva večkratna ponovitev z več različnimi začetnimi razvrstitvami. Dve najbolj znani in najpogosteje uporabljeni nehierarhični metodi sta metoda prestavljanj (k-means) in metoda voditeljev (leaders) (Ferligoj, 1989).

Zaradi narave svojih podatkov sem moral poseči po kombinirani metodi razvrščanja v skupine. Do razvrščanja v skupine sem pristopil v dveh korakih, in sicer:

1. Prilagojena metoda voditeljev: razvrščanje avtorjev v manjše reprezentativne skupine avtorjev

(26)

2. Prilagojena aglomerativna Wardova metoda združevanja: združevanje reprezentativnih skupin avtorjev z namenom odkritja povezav in določitve ustreznega končnega števila skupin

Razlog za takšen pristop je sledeč: uporabiti metodo voditeljev za skrčenje podatkov na manjše nize reprezentativnih skupin in nato hierarhično metodo za ugotovitev končnega števila in sestavo skupin (Kejžar, Korenjak-Černe, in Batagelj, 2011).

Slika 2.1: Prilagojena metoda voditeljev (psevdo koda):

Slika 2.2: Prilagojena aglomerativna Wardova metoda združevanja (psevdo koda):

Kombinirano metodo so razvili Nataša Kejžar, Vladimir Batagelj in Simona Korenjak-Černe (Kejžar in drugi, 2011), v sklopu paketa Clamix pa sta jo za programski jezik R implementirala Vladimir Batagelj in Nataša Kejžar. (Batagelj in Kejžar, 2016)

2.5 Opis podatkov

Podatke, ki sem jih uporabil pri svoji analizi, sem zajel iz baze SICRIS (informacijski sistem o raziskovalni dejavnosti v Sloveniji). Gre za obširno bazo podatkov slovenskih raziskovalcev, ki jo razvijata in vzdržujeta Institut informacijskih znanosti v Mariboru (IZUM) in Agencija za raziskovalno dejavnost republike Slovenije (ARRS).

(https://www.sicris.si/public/jqm/memo.aspx?lang=slv&opdescr=presentation&opt=6&subop t=1)

Baza SICRIS je tudi neposredno povezana s sistemom COBISS (Cooperative online

(27)

bibliographic system and services) oziroma z njegovo bibliografsko bazo podatkov COBIB. S to povezavo nudi uporabnikom neposreden vpogled v bibliografije raziskovalcev.

Zaradi velikega števila enot in v izogib šumom, ki bi jih lahko prinesle dodatne spremenljivke, sem se pri svoji analizi osredotočil zgolj na avtorje izvirnih znanstvenih člankov. Izvirni znanstveni članek je jasno definirana kategorija znanstvenih publikacij in je v COBISS-u označena s kodo 1.01. Izvirni znanstveni članek je samo prva objava originalnih raziskovalnih rezultatov v takšni obliki, da se raziskava lahko ponovi, ugotovitve pa preverijo.

Praviloma je organiziran po shemi IMRAD (Introduction, Methods, Results And Discussion) za eksperimentalne raziskave ali na deskriptivni način za deskriptivna znanstvena področja.

Objavljen mora biti v znanstveni reviji z recenzentskim sistemom sprejemanja člankov in recenziran. Recenzentski sistem mora biti razviden iz navodil avtorjem.

(http://home.izum.si/cobiss/bibliografije/tipologija_slv.pdf)

(28)

3 Empirični del 3.1 Orodja

3.1.1 R in RStudio

R je brezplačno programsko okolje in jezik, namenjeno vrsti statističnih izračunov in grafičnim prikazom. Njegove korenine segajo nazaj v leto 1993, ko sta ga razvila statistika Ross Ihaka in Robert Gentleman kot variacijo programskega jezika S. Danes se smatra programski jezik R kot de facto standard statistične obdelave in je standardno orodje tako v arzenalu akademikov, kot tudi tehnoloških gigantov kalibra Facebook in Google. R sicer že v svoji samostoječi osnovi ponuja pester nabor raznolikih orodij za modeliranje, obdelavo in prikaz statističnih podatkov, vse to pa uporabniki lahko še občutno nadgradijo z uporabo tako imenovanih R paketov. To so s strani uporabnikov spisane funkcije in metode, ki olajšajo uporabniško izkušnjo bodisi z implementacijo nove funkcionalnosti, izboljšavo oziroma pohitritvijo že obstoječe metode, ali pa z združitvijo večih manjših metod v eno samo, večopravilno metodo.

RStudio je brezplačno in odprtokodno integrirano razvijalno okolje (integrated development environment - IDE), namenjeno programiranju v jeziku R. Gre za uporabniški vmesnik, znotraj katerega so razvijalcu podatki predočeni na bolj intuitiven in pregleden način. Prav tako ima implementirane dodatne funkcionalnosti in »bonbončke«, s katerimi je razvijalcem olajšano delo, med drugim tudi upravljalnik R paketov (Rstudio Package Manager).

3.1.2 SQL in DB4S

SQL oziroma Structured Query Language je najbolj razširjen in standardiziran povpraševalni jezik za delo z relacijskimi bazami podatkov. Njegovi zametki segajo do leta 1970, SQL standardi in z njimi iteracije jezika pa so se razvijali od leta 1986 do danes. Gre za lahko berljiv in intuitiven jezik, saj uporabnik do željenih podatkov dostopa z uporabno deskriptivnih sintaktičnih ukazov, kot so SELECT, FROM, WHERE, GROUP BY in tako dalje. Jezik SQL se je od predhodnikov ponašal z eno ogromno prednostjo – uporabniki so sedaj lahko poizvedovali po večih zapisih v ločenih tabelah z enim samim klicem in uporabo relacij med tabelami.

DB4S ali SQLite Database Browser je zastonjski, odprtokoden uporabniški vmesnik za kreairanje, odpiranje, poizvedovanje in manipulacijo s podatkovnimi bazami in njenimi

(29)

podatki. SQLite je odprtokodna implementacija relacijske podatkovne baze, ki pa za delo s podatki uporablja jezik SQL.

3.1.3 Python

Python je visokonivojski, objektno orientiran programski jezik in eden izmed najbolj razširjenih in priljubljenih programskih jezikov na svetu danes. Njegov kreator, Guido van Rossum, ga je leta 1991 ustvaril z upoštevanjem načel berljivosti in intuitivnosti. Njegova sintaksa je tako dobro berljiva in jasna, kljub temu pa je Python hiter in robusten programski jezik, ki uporabniku nudi vrsto funkcionalnosti. Že vrsto leto stoji ob boku jeziku R kot eden od vodilnih jezikov na področjih statistike, analitike in znanstvene obdelave, v zadnjih nekaj letih pa je z razširitvijo preko paketov, kot so Pandas, TensorFlow in Scikit-learn, postal najbolj uporabljan jezik v podatkovnih znanostih.

3.2 Analiza

3.2.1 Priprava podatkov

Postopek priprave podatkov je bil izveden z vpeljavo potrebnih R knjižnic v RStudio ter vzpostavitvijo delovne baze, od koder sem črpal podatke iz delovne mape. (slika 1.01)

Najprej sem s SQL ukazom iz baze prebral v tabelo vse objave vseh raziskovalcev, kjer so bili raziskovalci označeni z vlogo »avtor« in kjer je imel njihov tip publikacije oznako 1.01 (izvirni znanstveni članek). S tem sem dobil 82732 enot, kjer je ena enota število izvirnih znanstvenih člankov v danem letu za posameznega avtorja. (slika 2.01, 2.02)

Zaradi napake pri vnosu v bazo so bile popravljene letnice, konkretno pri dveh enotah, in sicer iz vrednosti 2997 v 1997. (slika 3.01, 3.02, 3.03)

V drugem koraku sem iz baze prebral v tabelo 21,237 enot, kjer je posamezna enota raziskovalec s svojo unikatno ID številko in njegovo prvo leto katerekoli objave. Tudi tu je bilo precej letnic v bazo prvotno napačno vnešenih. Po krajšem pregledu po bazi SICRIS sem ugotovil, da je najzgodnejše leto katerekoli objave leto 1922, avtorja z ID številko 00586, sicer vsem dobro poznanega pokojnega slovenskega literarnega kritika, esejista in politika, Josipa Vidmarja. Letnice nižje od 1922 sem štel kot napačne in jih v skladu s tem popravil.

(slika 4.01, 4.02, 4.03)

Nato sem ustvaril seznam letnic, segajočih vse od letnice prve objave nasploh (tab2 - 1922) pa

(30)

do letnice zadnje objave (tab1 - 2017), ampak samo za tiste letnice, ki jih ni v tab1. Ker sem se odločil analizo delati za 15-letno obdobje v karierah znanstvenih raziskovalcev, sem v izogib izključitvi avtorjev, ki so začeli objavljati šele pred kratkim, dodal še letnice od zadnje objave (2017) pa do letnice 2032. Z omejitvijo na prvih 15 let posameznikovega delovanja sem vzpostavil nek zaprt razpon let, da ne bi imel preveč praznih podatkov. Sicer bi moral vpeljati neko novo spremenljivko, na primer koliko časa je kdo aktiven, pa tudi krivulje bi bile različnih oblik. (slika 5.01)

Nadalje z uporabo paketa reshape2 svoje podatke o avtorjih in številu njihovih objav izvirnih znanstvenih člankov v danem letu iz tab1 preoblikujem iz podatkov tipa dolgega formata v podatke tipa širokega formata, jih poimenujem z novim imenom, dat1, in jih tako pripravim za nadaljno analizo. (slika 6.01, 6.02)

Zaradi boljše preglednosti in lažjega dela dalje stolpec (cobissID_avtorja) v dat1 prestavim v rownames (slika 7.01, 7.02)

Nato za vsa manjkajoča leta ustvarim vektorje, napolnjene s samimi ničlami in jih vstavim v dat1 ter ustrezno popravim imena stolpcev. S tem pristopom vse avtorje postavim na enako izhodiščno točko, ne glede na njihovo starost oziroma obdobje delovanja v znanosti. Z drugimi besedami, za vsa leta, ko avtorji niso imeli objav, v tabelo vstavim ničle. (slika 8.01, 8.02)

Za tem sem ustvaril seznam manjkajočih avtorjev. To je seznam ID številk raziskovalcev, ki se nahajajo v tab2, ne pa v dat1. To so bodisi avtorji, ki niso objavili izvirnega znanstvenega članka (1.01), ali pa raziskovalci, ki so sodelovali pri izvirnem znanstvenem članku, vendar niso bili navedeni kot avtorji. (slika 9.01, 9.02)

Nato sem ustvaril matriko dimenzij 7868x110 samih ničel, ki ustreza številu manjkajočih avtorjev (vrstice) in 110 letom (stolpci), vse od leta 1922 do leta 2032. Matriko sem pripisal spremenljivki »nule«, pravilno označil vrstice in stolpce, ter jo s klicem rbind pripel k dat1.

(slika 10.01, 10.02, 10.03)

Za tem sem dat1 še uredil, da ID številke raziskovalcev tečejo od najmanjše do najvišje. (slika 11.1)

V naslednjem koraku ustvarim nov, prazen podatkovni okvir in ga pripišem spremenljivki set15. To je podatkovni okvir za 15 let, ki ga bom uporabil pri končnem združevanju. (slika

(31)

12.1)

Nadalje z levo poravnavo poravnam praznino let za vse avtorje, ki imajo pred svojo prvo objavo same ničle (slika 13.1, 13.2)

Nazadnje spremenljivko set15 z ukazom »list« pretvorim v spremenljivko datalist in s tem so podatki pripravljeni na združevanje v skupine. (slika 14.1)

3.2.2 Združevanje v skupine

Pri združevanju v skupine sem zaradi narave podatkov, ki jih obdelujem (simbolni podatki), izbral metodo prilagojenih voditeljev (adapted leaders method) in v drugem koraku prirejeno aglomerativno Wardovo metodo združevanja (adapted agglomerative hierarchical Ward's clustering method).

Najprej z ukazom »create.symData« ustvarim symData objekt iz seznama podatkovnih okvirjev, ki je shranjen pod spremenljivko »datalist«, in ta objekt pripišem spremenljivki dataset_pDist. Kot argument podam tudi tip symData objekta, in sicer izberem pDist (probability) za verjetnostno porazdelitev. (slika 15.1, 15.2)

Tu na vrsto pride združevanje – S klicem funkcije za združevanje po metodi prilagojenih voditeljev, »leaderSO«, zaženem prvo združevanje. Kot argumente funkciji podam objekt dataset_pDist in število skupin (clusters), ki jih želim na koncu dobiti (maxL). To število je poljubno, zato se odločim za 25 skupin. Ob zagonu me funkcija vpraša po številu iteracij – odločim se za 30. (slika 16.1)

Po slabih 20 minutah je združevanje zaključeno in končam z 21 skupinami. Algoritem je ocenil, da so si enote v skupinah od 1 do vključno 5 tako zelo podobne, da jih je vse združil pod skupino 1, ki je z 9311 enotami tudi daleč največja skupina. (slika 17.1, 17.2).

Ko pogledam podatke, za kakšne enote gre, ugotovim, da so to vse enote brez vsakršne objave, zato lahko to skupino v nadaljevanju enostavno odstranim iz hierarhičnega združevanja v drugi fazi.

Iz podatkov izberem seznam pripadajočih skupin za vseh 21237 enot, jih shranim in ponovno naložim za nadaljnjo analizo. (slika 18.1)

Tu izračunam predstavnike skupin kot povprečje enot, ki pripadajo tej skupini (slika 19.1, 19.2)

(32)

S klicem do.call preoblikujem a_pD iz lista v lepše berljivo tabelo podatkov, dataframe, kjer so v vrsticah številke mojih skupin, v stolpcih pa leta, od 1 do 15. (slika 20.1, 20.2)

V tem koraku odstranim že prej omenjeno neuporabno skupino raziskovalcev brez objav (cluster 1) in z novo dobljenim seznamom 20 skupin ustvarim nov symData objekt, ter ga pripišem spremenljivki dataset2_pD. Kot argument, ki določa tip symData objekta, izberem

»pDist«, kar pomeni, da bo šlo za verjetnostno razporeditev. (slika 21.1, 21.2)

Na tej točki poženem prilagojeno aglomerativno hierarhično združevanje in za tip združevanja izberem ward.D2 metodo. Ward D2 metoda za razliko od navadne Wardove metode (D1) kvadrira evklidske razdalje, preden jih uporabi pri združevanju. (slika 22.1)

Dobljeno hierarhično strukturo nato prikažem kot dendrogram. (slika 22.2)

Glede na dobljeno sliko in relativno bližino med posameznimi skupinami se odločim za izbiro treh končnih skupin. Dolžina vertikalnih črt oz. razlika v dolžini vertikalnih črt med dvema skupinama priča o medsebojni različnosti teh dveh skupin. Kjer so črte dolge, so razlike med skupinami velike. (slika 23.1, 23.2)

Slika 3.1: Dendrogram razvrščanja v skupine z Wardovo hierarhično metodo združevanja

(33)

Nato z indeksiranjem iz tabele reducedDat_pD odstranim celotno prvo vrsto ničel in novodobljeno tabelo pripišem spremenljivki describedDat_pD. (slika 24.1, 24.2, 24.3)

Z ukazom colSums za vsako izmed 20 skupin v describedDat_pD seštejem vrednosti stolpcev in jih v skladu s podatki v clst_pD2 pripišem trem novim spremenljivkam, a1_pD2, a2_pD2 in a3_pD2, ki odgovarjajo izbranim končnim trem skupinam. (slika 25.1, 25.2)

Zatem z metodo cbind pripnem te novo dobljene spremenljivke v tabelo tser_pD2 in jo nato s klicem melt preoblikujem v format, ki je primernejši za končni grafični izris. (slika 26.1, 26.2, 26.3)

Na koncu pa z ukazom ggplot in potrebnimi argumenti izrišem grafični prikaz krivulj trendov objav za vsako od treh skupin tekom 15 let (slika 27.1, 27.2)

Slika 3.2: Graf trednov objav treh skupin v razponu 15 let

(34)

3.3 Opis skupin in interpretacija podatkov

Po hierarhičnem zduževanju sem končal s tremi zaključenimi skupinami in z eno posebno skupino t.i. »osamelcev«. Značilnost prvih treh skupin je, da so si med seboj kar se da različne, ter da so si enote znotraj ene od teh skupin kar se da podobne. Četrto skupino, skupino outlierjev tvorijo zgolj enote oz. avtorji brez objav. Zato je v dendrogramu (slika 23.1) namesto 25 podskupin moč videti zgolj 20 podskupin in v grafičnem izrisu (slika 27.2) zgolj 3, ne 4 skupine. Vse 4 skupine pa so prišle v poštev pri postanalizi ki sem jo opravil v Pythonu.

Rezultati so bili sledeči:

Zanimivo je, da je skupina outlierjev daleč najbolj zastopana skupina, s kar 9311 enotami oz.

s precejšnjim deležem; 44 %. Enote po ostalih treh skupinah so bolj ali manj enakomerno razporejene, sledijo pa si po vrsti: v prvi skupini je 4889 enot, kar predstavlja 23 % celote, v drugi 3687 oz. 17 %, v tretji pa 3350 enot s 16 %.

Izmed vseh enot, vključenih v analizo, je družboslovcev 2771 in predstavljajo 13 %, naravoslovcev pa 3384 oz. 16 %. Tu je potrebno izpostaviti, da gre izključno za enote, ki so imele kot področje znanosti označeno zgolj »Družboslovje« ali »Naravoslovje«. Sem niso šteti avtorji, ki delujejo v sorodnih znanostih ali podznanostih, kot sta na primer humanistika ali tehnika.

V postanalizi me je nadalje zanimal sestoj družboslovcev in naravoslovcev, oz. natančneje, v kolikšni meri kdo od njih pripada kateri izmed štirih skupin, vključno z outlierji. Tu smo ponovno priča zanimivemu rezultatu, ki kliče po interpretativnem okvirju, ki bi umel osmisliti takšno diskrepanco. Namreč, razporeditev naravoslovcev je skorajda povsem uniformna, z okvirno četrtino enot po skupini, medtem ko pri družboslovcih levji delež enot pade v skupino outlierjev – tistih brez objav. Takšnih je pri družboslovcih kar 1307 in predstavljajo 47 % vseh družboslovcev!

Prav tako je razporeditev enot po ostalih prvih treh skupinah pri družboslovcih drugačna kot pri naravoslovcih. Kot sem že prej omenil, je pri slednjih ta skoraj povsem uniformna in sicer z 901 enotami (27 %) v prvi, 844 enotami (25 %) v drugi in 777 enotami (23 %) v tretji skupini. Pri družboslovcih je zgodba drugačna – prva skupina je najbolj obljudena z 771 enotami (28 %), sledi ji druga skupina z 413 enotami (15 %) in na koncu tretja skupina, ki šteje 280 enot (10 %).

(35)

Če se vrnemo iz postanalize nazaj k osnovni analizi in si ogledamo graf naših treh skupin, lahko hitro opazimo distinktivne razlike med njimi. (slika 27.2)

Na grafu so prikazane naše tri skupine, ki so nastale kot rezultat prilagojenega aglomerativnega hierarhičnega združevanja. Prva skupina je na grafu označena z rdečo, druga z zeleno in tretja z modro barvo. Najbolj vnebovpijoča razlika je tista med prvo skupino in ostalima dvema.

V grobem sta si skupini 2 in 3 po obliki krivulje precej podobni. Čeprav ima ena malenkost nižji vrh, ki ga doseže v precej krajšem času (razlika štirih let) in ima že v izhodišču več objav v danem letu, pa obe sledita istemu trendu – enakomerna do eksponentna rast, vrh nekje med četrtim in osmim letom, nato pa podobno znaten padec vse do konca 15. leta. Pri prvi skupini pa lahko opazujemo konstantno, skorajda eksponentno rast vse do konca 14. leta.

Če se poglobimo v vsako posamezno skupino posebej, opazimo naslednje:

Avtorji prve skupine začnejo v povprečju v prvem letu z malce več kot eno objavo in imajo od prvega do drugega leta rahel padec. Od drugega leta delovanja dalje njihove objave prično strmo naraščati s skoraj eksponentno rastjo, vse do njihovega desetega leta delovanja, ko se krivulja spremeni v bolj linearno funkcijo rasti. Od desetega leta dalje njihovo število objav še dalje strmo narašča, dokler se v 13. oziroma 14. letu delovanja ne ustavi v samem vrhu, pri povprečno malce manj kot 9 objavah v letu.

V drugi skupini začnejo avtorji v povprečju s po eno objavo v prvem letu. Njihovo število objav v danem letu skozi vsa leta narašča, enkrat bolj strmo, drugič malo manj, dokler v 8.

letu delovanja ne doseže samega vrha, z malce več kot 5 objavami na leto. Od osmega leta pa vse do konca pa je moč zaznati znaten upad v številu objav v danem letu delovanja. Med 12.

in 13. letom delovanja krivulja preide mejo ene objave na leto in vse do konca 15. leta delovanja ne doživi nikakršne rasti.

Pri tretji skupini je moč videti, da imajo avtorji že v prvem letu delovanja skoraj 2,5 objave na leto. Od tu njihovo število objav v danem letu strmo, skorajda eksponentno narašča, vendar je ta rast zelo kratkoživa. Avtorji te skupine namreč v povprečju dosežejo vrh v svojem 4. letu delovanja, z malce manj kot 5 objavami letno. Od 4. do 6. leta dalje se občuti strm padec do ene same objave letno, nato pa se padec do konca 15. leta nadaljuje, vendar bolj postopno. Od 9. leta delovanja dalje v povprečju ne objavijo skorajda nič.

Reference

POVEZANI DOKUMENTI

Iz porazdelitev vrednosti atributov na Sliki 1 je možno razbrati, da imajo preiskovanci z večjo sto- pnjo kognitivnega upada vse nižje število fiksacij na časovno

Zaradi velike razlike med podatkoma o krčitvah smo karto krčitev vizualno primerjali z ortofotom obeh izbranih let, pregledali sistem zbiranja podatkov o krčitvah oziroma

Teja Koler Povh, Primož Južnič, Žiga Turk, Goran Turk - ANALIZA ZNANSTVENIH OBJAV V SLOVENSKEM GRADBENIŠTVU IN GEODEZIJI NA PRIMERU UL FGG..

Proučili bomo razlike v različnih dostopnih (objavljenih) orisih nanopodročja. Predvidevamo, da se različne iskalne metodologije ne bodo bistveno razlikovale pri iskalnem odzivu

Tako pri sorti 'Franquette' (Slika 14), kot pri sorti 'Elit' (Slika 15), so bile v obeh terminih razlike med vsebnostmi (+)-katehina pri ekstrakcijah z različnimi

Srednje vrednosti z različnimi malimi črkami (a,b,c,d,e,f) v vrsticah so statistično značilne (P <0,05; razlike med uporabljenimi gnojili); srednje vrednosti z različnimi

V prispevku je v ospredju analiza metafore z lingvističnega vidika, in sicer glede na njeno slovnično oziroma sintaktično strukturo (enobesedne metafore/metaforične

Danes iz vidika kulturnega transferja ne osvetljujemo zgolj medsebojnih izmenjav med deželami, temveč tudi med različnimi geografskimi in družbenimi prostori, regijami,