• Rezultati Niso Bili Najdeni

ANALIZA OMREŽJA VOZLIŠČ SPLETNE STRANI IMGUR Diplomsko delo

N/A
N/A
Protected

Academic year: 2022

Share "ANALIZA OMREŽJA VOZLIŠČ SPLETNE STRANI IMGUR Diplomsko delo"

Copied!
69
0
0

Celotno besedilo

(1)

UNIVERZA V LJUBLJANI FAKULTETA ZA DRUŽBENE VEDE

Tim Kokošinek

ANALIZA OMREŽJA VOZLIŠČ SPLETNE STRANI IMGUR Diplomsko delo

Ljubljana, 2021

(2)

UNIVERZA V LJUBLJANI FAKULTETA ZA DRUŽBENE VEDE

Tim Kokošinek

Mentor: prof. dr. Andrej Mrvar

ANALIZA OMREŽJA VOZLIŠČ SPLETNE STRANI IMGUR Diplomsko delo

Ljubljana, 2021

(3)

Iskreno se zahvaljujem staršema za vso podporo v času študija.

Zahvala gre tudi mentorju prof. dr. Andreju Mrvarju, ki me je v času študija veliko naučil in mi pomagal pri pisanju diplomskega dela.

(4)

Analiza omrežja vozlišč spletne strani Imgur

Internet je neverjetno orodje, ki z vsakim dnem vzdržuje nove trende in tehnološki napredek.

Tu se zdi, da so ena izmed največjih dosežkov interneta nedvomno spletna mesta za družabna omrežja, ki so pravi blagoslov za današnjo generacijo. Že samo ime pove, da so to mesta, ki združujejo različne skupnosti posameznikov. Gre za platforme za vzpostavljanje in ohranjanje povezav z drugimi osebami, kadar koli si to zaželimo. Nedvomno se spletna mesta, kot so Twitter, Facebook in Imgur, izkažejo za koristna na vseh področjih življenja, naj gre za študenta, otroka ali upokojenca. Osrednja tema obravnave je analiza omrežja vozlišč, zajetih iz spletne strani Imgur. Z uporabo programa Pajek, ki se uporablja za analizo socialnih omrežij, bom analiziral omrežje vozlišč, z namenom odkrivanja in izpostavljanja najbolj popularnih vsebin na spletni strani Imgur. V analizi se bom osredotočil na več vrst podatkov o omrežju, kot so identifikacija najpomembnejših enot v omrežju, najgosteje povezanih skupin vozlišč in mer središčnosti.

Ključne besede: Imgur, vozlišča, analiza socialnih omrežij, Pajek, analiza vozlišč.

Imgur tag network analysis

The Internet is an amazing tool that maintains new trends and technological advances each day.

And here it seems that one of the greatest achievements of the Internet are undoubtedly social networking sites, which are a real blessing for today’s generation. The name itself suggests that these are places that bring together different communities of individuals. They are platforms used to establish and maintain a connection with other people whenever we desire to do so.

Social sites like Twitter, Facebook and Imgur undoubtedly benefit all areas of life, be it for students, children or retirees. The central theme focuses on an analysis of a network of tags taken from the Imgur website. Using a program called Pajek, which is used to analyze social networks, I will analyze the network of tags in order to discover the most popular content on the Imgur website. In the analysis I will focus on several types of network data, such as the identification of the most important units in the network, the most densely connected groups of tags and measures of centralization.

Keywords: Imgur, tags, social network analysis, Pajek, analysis of tags.

(5)

5

Kazalo vsebine

1 UVOD ... 9

2 Teoretični del ... 10

2.1 Spletna socialna omrežja ... 10

2.1.1 Imgur ... 13

2.1.2 Vozlišča ... 14

2.2 Analiza socialnih omrežij ... 15

2.2.1 Osnovne lastnosti omrežij ... 16

2.2.2 Pajek ... 17

2.2.3 Premer ... 18

2.2.4 Stopnja točke ... 18

2.2.5 Krepke/šibke in dvopovezane komponente ... 19

2.2.6 Jedra ... 20

2.2.7 Klike ... 21

2.2.8 Triade ... 21

2.2.9 Mere središčnosti ... 22

2.2.9.1 Degree centrality – mera središčnosti glede na stopnjo ... 23

2.2.9.2 Closeness centrality – mera središčnosti glede na dostopnost ... 23

2.2.9.3 Betwenness centrality – mera središčnosti glede na vmesnost ... 23

2.2.9.4 Usredinjenost omrežja ... 24

2.2.10 Kazala in opisi ... 24

2.2.11 Utežena stopnja ... 24

2.2.12 Otoki ... 25

2.2.13 Metode iskanja skupin ... 25

3 Empirični del ... 26

3.1 Metodologija ... 26

3.1.1 Hipoteze ... 26

3.2 Priprava podatkov za analizo ... 27

(6)

6

3.2.1 Imgurjev aplikacijski programski vmesnik ... 27

3.2.2 Python ... 30

3.3 Rezultati analize ... 36

3.3.1 Premer ... 36

3.3.2 Stopnje vozlišč ... 37

3.3.3 Krepke/šibke in dvopovezane komponente ... 40

3.3.4 Jedra ... 44

3.3.5 Klike ... 46

3.3.6 Triade ... 49

3.3.7 Mere središčnosti ... 50

3.3.8 Kazala in opisi ... 52

3.3.9 Utežena stopnja ... 54

3.3.10 Otoki ... 55

3.3.11 Metode iskanja skupin ... 57

3.3.12 Analiza objav in komentarjev ... 58

3.3.12.1 Humorne vsebine ... 59

3.3.12.2 Politična usmerjenost ... 60

3.3.12.3 Pomoč in podpora ... 61

3.3.12.4 Vsebine o živalih ... 62

4 Ugotovitve ... 64

5 Zaključek ... 67

6 Viri ... 68

Kazalo slik

Slika 2.1: Spletna stran Imgur ... 14

Slika 2.2: Objava vsebine in določanje vozlišč ... 15

Slika 2.3: Program Pajek ... 18

Slika 2.4: Možne triade ... 22

(7)

7

Slika 3.1: Registracija aplikacije ... 29

Slika 3.2: Client ID, Client secret ... 30

Slika 3.3: Izris omrežja v Pythonu (narisane prve dve strani objav za boljšo preglednost) ... 31

Slika 3.4: Koda za zajem podatkov in izris omrežja v Pythonu ... 32

Slika 3.5: Uvoz preostalih modulov ... 33

Slika 3.6: Koda za zajem podatkov in kreacijo omrežja v Pajku ... 33

Slika 3.7: Nenormalizirane vrednosti povezav ... 34

Slika 3.8: Omrežje vozlišč v programu Pajek ... 35

Slika 3.9: Urejeno omrežje vozlišč... 35

Slika 3.10: Najdaljši najkrajši poti med »notreally« in »freedom« glede na dolžino ... 36

Slika 3.11: Najdaljši najkrajši poti med »notreally« in »freedom« glede na vrednost ... 37

Slika 3.12: Omrežje glede na stopnjo vozlišč ... 38

Slika 3.13: Frekvenčna porazdelitev stopenj ... 39

Slika 3.14: Prikaz komponent ... 41

Slika 3.15: Frekvenčne porazdelitve komponent ... 42

Slika 3.16: Del hierarhije in del artikulacijskih točk ... 43

Slika 3.17: Največja dvopovezana komponenta ... 44

Slika 3.18: Frekvenčna porazdelitev jeder ... 45

Slika 3.19: Jedro najvišje stopnje ... 45

Slika 3.20: Klike na 5 vozliščih ... 47

Slika 3.21: Del števila nastopov znotraj klik – urejeno od največje vrednosti navzdol ... 48

Slika 3.22: Triade ... 49

Slika 3.23: Mere središčnosti – del podatkov urejenih od največje vrednosti navzdol ... 50

Slika 3.24: Kazala/opisi ... 52

Slika 3.25: Kazala/opisi – del podatkov urejenih od največje vrednosti navzdol ... 53

Slika 3.26: Utežena stopnja vozlišč – del podatkov urejenih od največje vrednosti navzdol .. 54

Slika 3.27: Otoki ... 55

Slika 3.28: Največji otok ... 56

Slika 3.29: Metoda Louvain (parameter 1) ... 57

(8)

8

Slika 3.30: Metoda VOS (parameter 1) ... 58

Slika 3.31: Število objav z vozliščem ... 59

Slika 3.32: Objave z vozliščem »trump« ... 60

Slika 3.33: Primer komentarjev pod objavo z vozliščem »trump« ... 61

Slika 3.34: Primer komentarjev pod objavo z vozliščem »cancer« ... 62

Slika 3.35: Primer objav z vozliščem »aww« ... 63

(9)

9

1 UVOD

»Ljudje se v vsakdanjem življenju povezujemo v mnogo različnih socialnih omrežij. Socialno omrežje je opredeljeno kot končno število akterjev oziroma enot in ene ali več relacij med njimi« (Podreberšek, 2005, str. 7). Socialna omrežja se lahko ustvarjajo znotraj družine, v šolah, gimnazijah in fakultetah, na delovnih mestih, pri športnih aktivnostih in znotraj družbenih medijev. Socialna omrežja najdemo v vseh porah družbenega življenja, zato je analiza socialnih omrežij pomemben predmet preučevanja, s katero poglobljeno opisujemo in raziskujemo relacije med enotami znotraj omrežij.

Analiza socialnih omrežij ima svoje teoretične korenine v delu zgodnjih sociologov, kot sta Georg Simmel in Émile Durkheim, ki sta govorila o pomembnosti preučevanja vzorcev odnosov, ki nastajajo med družbenimi akterji. Družboslovci so na začetku 20. stoletja začeli uporabljati koncept socialnih omrežij, s katerim so označili zapletene skupine relacij med člani družbenih sistemov (Scott, 2012). Analiza socialnih omrežij se uporablja v mnogo različnih akademskih disciplinah, tudi v praktičnih aplikacijah, kot sta boj proti pranju denarja in terorizmu. V diplomskem delu bom izvedel analizo na spletnem socialnem omrežju Imgur.

Spletna socialna omrežja so spletna mesta, ki združujejo ljudi z namenom, da se med seboj pogovarjajo, delijo ideje in interese ali pridobijo nove prijatelje. Ta vrsta sodelovanja in skupne rabe je znana kot družabni medij. Za razliko od tradicionalnih socialnih omrežij, ki jih običajno ustvarja do največ deset ljudi, spletna mesta v družabnih omrežjih vsebujejo vsebine, ki jih ustvari na stotine ali celo milijone različnih ljudi (Boyd in Ellison, 2008). Primeri spletnih socialnih omrežij so Facebook, Twitter, LinkedIn, Reddit, Instagram in Imgur.

V diplomskem delu se bom lotil analize socialnega spletnega omrežja Imgur, kjer ne bom analiziral posameznikov in njihovih relacij, ampak bom izvedel analizo na podlagi najbolj popularnih vsebin, ki so jih posamezniki objavili. Posebnost spletne strani Imgur je, da uporabniki označijo vsebine s tako imenovanimi vozlišči (ang. Tags), ki predstavljajo vsebino objave. Vozlišča predstavljajo točke v omrežju, relacije med vozlišči predstavljajo število pojavov, kjer se dve vozlišči skupaj pojavita v objavi. Za analizo sem izbral 600 najbolj popularnih objav na spletni strani in zajel vsa vozlišča v objavah, na podlagi katerih bom z različnimi metodami analize socialnih omrežij ugotavljal, katera vozlišča prevladujejo v omrežju in posledično, katere vsebine so najbolj popularne na spletni strani Imgur.

(10)

10

2 Teoretični del

2.1 Spletna socialna omrežja

Ena glavnih motivacij za uporabo interneta so spletna socialna omrežja. V zadnjih 15 letih se je število spletnih socialnih omrežij, kot so Facebook, MySpace, Twitter, Instagram, LinkedIn, Imgur in Reddit, ne samo povečalo, temveč je njihova uporaba postala nekaj vsakdanjega za milijone ljudi po svetu. Uporabniki teh spletnih mest sodelujejo v številnih dejavnostih, vključno z branjem in komentiranjem spletnih objav, pošiljanjem mnenj in ocenjevanjem nakupovalnih spletnih mest, iskanjem informacij, izmenjavo svojih osebnih izkušenj in mnenj, objavljanjem slik in dogodkov in še veliko drugih stvari. Poleg tega spletna omrežja pomagajo članom skupnosti najti uporabnike s podobnimi interesi, kar je osnova za socialno interakcijo (Boyd in Ellison, 2008). »Veliko posameznikov iz vseh generacij porabi precej časa za uporabo spletnih socialnih omrežij za pošiljanje sporočil, izmenjavo informacij in ohranjanje stikov s prijatelji. Mladostniki na primer brskajo po omrežjih iz različnih razlogov, vključno z interakcijo z drugimi in izmenjavo svojih potovalnih izkušenj« (Nusair, Bilgihan in Okumus, 2013, str. 459).

Ustvarjalci spletnih socialnih omrežij morajo ciljno publiko segmentirati glede na starost, saj imajo generacije skupen in razločen družbeni značaj, ki ga oblikujejo njihove izkušnje skozi čas. Zaradi tehnoloških, družbenokulturnih in ekonomskih dejavnikov imajo pripadniki različnih generacij različna stališča, vrednote in vedenje kot druge generacije. Generacija Y je ekonomsko robustna generacija, ki zajema več kot 80 milijonov ljudi po svetu in letno porabi približno 200 milijard evrov, kar predstavlja približno polovico porabe v gospodarstvu (Nusair in drugi, 2013). Ustvarjalci spletnih omrežij bodo seveda skušali na svojo stran pridobiti uporabnike te generacije, saj prinašajo največ zaslužka.

Izmenjava informacij je ena od motivacij za uporabo socialnih omrežij. Spletna socialna omrežja pospešujejo interakcije med uporabniki spleta. Številna omrežja svojim uporabnikom omogočajo objavo in izmenjavo komentarjev, mnenj in osebnih izkušenj, povezanih s katero koli temo, o kateri želijo govoriti, ki nato drugim služi kot informacija (Pai in Yeh, 2014). Eno takšnih spletnih socialnih omrežij je Imgur. Zaupanje je ključnega pomena za uspešno spletno interakcijo. Zaupanje je predpogoj za samorazkritje, saj zmanjšuje zaznana tveganja pri razkrivanju zasebnih informacij. Je ključnega pomena za vzpostavljanje odnosov med

(11)

11

uporabniki znotraj spletnih socialnih omrežij. Pomembnega pomena je tudi lojalnost oziroma zvestoba uporabnikov. Zvestoba je pomemben člen poslovanja. Če je uporabnikom všeč spletno mesto, je verjetneje, da ga bodo ponovno obiskali. Zdi se, da članom skupnosti spletnih socialnih omrežij pogosto primanjkuje zvestobe, saj hodijo iz ene skupnosti v drugo ali s časom manj uporabljajo svojo skupnost (Currás‐Pérez, Ruiz‐Mafé in Sanz‐Blas, 2013). Če želi spletna stran preživeti, mora zagotavljati zvestobo uporabnikov.

Čeprav so ključne tehnološke značilnosti omenjenih spletnih strani dokaj skladne, so si kulture, ki se pojavljajo okoli spletnih socialnih omrežij, precej različne. Večina spletnih mest podpira vzdrževanje že obstoječih socialnih omrežij, druga uporabnikom pomagajo pri povezovanju na podlagi skupnih interesov, političnih stališč ali dejavnosti. Nekatera spletna mesta so namenjena vsej publiki, druga privabljajo ljudi na podlagi skupnega jezika ali skupnih rasnih, spolnih ali verskih identitet (Nusair in drugi, 2013). »Nekatera spletna mesta so zasnovana z upoštevanjem posebnih etničnih, verskih, spolnih usmerjenosti, političnih ali drugih identitetnih kategorij. Obstajajo celo spletna socialna omrežja za pse in mačke, čeprav morajo njihovi lastniki upravljati te profile. Čeprav so spletna socialna omrežja pogosto zasnovana tako, da so široko dostopna, mnoga na začetku privabljajo homogeno prebivalstvo. Zato obstaja mnogo skupin, ki uporabljajo spletna mesta za ločevanje po narodnosti, starosti, izobrazbi ali drugih dejavnikih, ki običajno segmentirajo družbo, četudi to ni namen ustvarjalcev« (Boyd in Ellison, 2008, str. 214).

»Na spletnih mestih socialnih omrežij so državljani pogosto izpostavljeni objavam političnih novic, ki so vgrajene v šaljive vsebinske objave, na primer smešne videoposnetke ali slike«

(Matthes in Heiss, 2019, str. 100). Spletna mesta socialnih omrežij so postala pomemben nov vir političnih informacij. Večina uporabnikov spletnih socialnih omrežij je izpostavljena mešanici političnih in nepolitičnih vsebin, kjer se politične novice vedno pogosteje objavljajo s šaljivo kontekstno objavo. Humorne politične objave so na tovrstnih spletnih straneh zelo popularne. Uporabniki se na različne načine norčujejo iz politikov in političnih usmeritev, s katerimi se ne strinjajo. Tako istočasno objavijo neko humorno vsebino in izpostavijo svoje politično mnenje. Spletna stran Imgur je še posebno dober primer, saj vse objave vsebujejo slike ali različne slikovne formate (npr. GIF) (Brubaker, Church, Hansen, Pelham in Ostler, 2018).

Če želijo uporabniki objaviti resne politične vsebine, bodo najverjetneje za to uporabili druge vrste spletnih socialnih omrežij, kot je Twitter, na Imgurju bodo imele politične vsebine večinoma humoren kontekst.

(12)

12

Več ugotovitev kaže, da lahko naključna izpostavljenost političnim vsebinam, vključenih v humorne oz. smešne objave, spodbudi politično vključevanje manj vpletenih uporabnikov.

Uporaba socialnih medijev za gledanje humornih objav lahko spodbudi kognitivne vire, ki se nato uporabijo za branje in obdelavo vgrajenih političnih novic v socialnih medijih (Matthes in Heiss, 2019). Politične vsebine se seveda delijo na levo in desno usmerjene. Na vseh popularnih socialnih omrežij bo mešanica uporabnikov in objav leve in desne politične usmeritve, vendar določene raziskave kažejo na to, da uporaba spletnih medijev zmanjšuje podporo desničarskemu populizmu (Boulianne, Koc-Michalska in Bimber, 2020). To je posebej opazno na spletnih socialnih omrežjih, kot je Reddit, saj so na spletni strani med trenutno najbolj popularnimi objavami konstantno politične objave leve politične usmeritve.

»Spletne skupine lahko postanejo skupnosti, razvijajo identifikacijo skupin in spodbujajo deindividualizacijo« (Mikal, Rice, Kent in Uchino, 2015, str. 1). Zaradi razvoja interneta in socialnih omrežij lahko posamezniki po vsem svetu najdejo druge osebe, ki imajo skupne interese. Tako takšne spletne skupnosti, kot je Imgur, razvijejo občutek pripadnosti in imajo člane, ki se identificirajo s skupino. Na identifikacijo uporabnikov lahko vplivajo namen spletne strani, načini, kako člani uporabljajo spletno mesto ter različne značilnosti, kot so velikost skupine, anonimnost in ovire za vstop in izstop iz skupine. Identifikacija in deindividualizacija se lahko pojavita tudi v zelo velikih anonimnih spletnih skupinah z malo zahtevami za vstop.

V primeru uporabnikov spletne strani Imgur je raziskava, izvedena v obliki ankete, pokazala, da pride do identifikacije in deindividualizacije uporabnikov, vendar ne na močne ali preproste načine (Mikal in drugi, 2015).

Spletne socialne skupnosti lahko predstavljajo vir podpore za posameznike, ki se spopadajo s stresnimi situacijami, vključno z boleznimi, kot so rak, bolezni srca in depresijo. Omrežja s spletno podporo so še posebej koristna za osebe, ki ne prejmejo socialne podpore v resničnem življenju in se zato zatečejo k spletnim skupnostim (Hale, Collins, in Kilgo, 2020). »Socialna podpora je čustvena, instrumentalna in finančna pomoč, ki jo dobimo iz lastne socialne mreže.

Razpoložljivost in sprejemanje socialne podpore lahko ima za posameznike, ki imajo zdravstvene težave, kot je rak, pomembne posledice za psihološko in fizično zdravje« (Hale in drugi, 2020, str. 2). Rezultati študij kažejo na prisotnost socialne podpore in ugotavljajo, da je vključitev narativnih značilnosti v objave, povezane z rakom, vplivala na zagotavljanje podpore v komentarjih.

(13)

13

2.1.1 Imgur

Imgur je spletno mesto za objavo in gostovanje slik, ki mesečno nabere več kot 250 milijonov obiskovalcev (Hale in drugi, 2020) in je priljubljeno predvsem zaradi enostavnosti uporabe in prilagodljivosti. Storitev gostovanja slik posameznikom omogoča nalaganje slik na internetno spletno mesto. Na spletni strani se brezplačno gostijo slike v različnih oblikah, vključno z animiranimi datotekami GIF, podprte z oglaševanjem in plačljivimi profesionalnimi računi. Te slike se hranijo na spletu brezplačno in se izbrišejo le, če v katerem koli šestmesečnem obdobju do slike ne dostopa noben uporabnik vsaj enkrat. Uporabniki spletnega mesta lahko objavljajo komentarje, uporabljajo orodja za ustvarjanje novih slik in jih nato delijo tako z uporabniki Imgurja kot s širšim internetom.

Uporabniki lahko na objavah glasujejo gor ali dol (ang. upvotes/downvotes), več kot ima objava glasov gor, bolj je popularna. Uporabniki lahko objave razvrstijo glede na popularnost, kjer se najprej prikažejo objave z največ glasovi ali glede na novost, kjer se najprej prikažejo najnovejše objave. Pod vsako objavo lahko uporabniki napišejo svoj komentar, ali odgovorijo na komentar druge osebe. Tako kot pri objavah, se tudi pri komentarjih glasuje gor ali dol, najbolj popularni komentarji bodo na vrhu. V diplomskem delu sem zajel najbolj popularne objave vsega časa, kar pomeni, da sem zajel objave z največ glasovi na gor. Slika 2.1 prikazuje spletno stran Imgur.

(14)

14 Slika 2.1: Spletna stran Imgur

2.1.2 Vozlišča

Vozlišča oziroma oznake na Imgurju so najboljši način, da uporabnik spletne strani poišče več objav o vrstah stvari, ki ga zanimajo. Ko posameznik ustvari svojo objavo, jo lahko označi z največ petimi vozlišči. Ta vozlišča na neki način opisujejo, kakšne vrste objava je to. Če to ponazorimo s primerom, lahko rečemo, da je oseba slikala svojo mačko, ko je le-ta naredila nekaj smešnega. To sliko je objavila na Imgur in dodala tri vozlišča, ki so »cats (mačke)«, »aww (beseda se uporablja za izražanje sočutja)« in »funny (smešno)«. Uporabniki lahko sortirajo prikaz vsebin tudi po vozliščih, ne samo po popularnosti ali novosti objav. Če nekoga zanimajo mačke, mora samo pritisniti na vozlišče »cats«, in prikazale se mu bodo vse vsebine, ki vsebujejo to vozlišče. Zatem lahko zopet razvrsti vsebine tako, da so sortirane po novosti ali popularnosti.

Označevanje objave z vozlišči zagotavlja, da jo lahko uporabniki zlahka najdejo, vendar za objavo na Imgur le-to ni potrebno. Kljub temu je velika večina objav označena z vozlišči, običajno z vsaj tremi. Noben drug član skupnosti ne more dodati vozlišč v objavo, le-te lahko doda samo ustvarjalec prispevka. Občasno lahko osebje Imgurja objavo označi s posebnimi oznakami, na primer oznako »Staff Picks«, če jih je določena objava navdušila.

(15)

15

Ko uporabnik ustvarja objavo, bo po kliku na gumb »Nova objava« naložil slike, ki jih želi pokazati v svoji objavi. Na desni strani objave se nahaja razdelek, kamor lahko doda vozlišča.

Ko klikne nanj, se prikažejo najbolj priljubljena vozlišča na spletni strani in število objav s posameznim vozliščem. Med njimi lahko izbere vozlišče, ki je najprimernejše za njegovo objavo, ali si ogleda več možnosti. V opisu objave lahko uporabi tudi oznake »ang. hashtags (#)«, ki bodo samodejno dodale označeno besedo kot vozlišče v objavo. Slika 2.2 prikazuje določanje vozlišč na objavi.

Slika 2.2: Objava vsebine in določanje vozlišč

2.2 Analiza socialnih omrežij

Analiza socialnih omrežij ponuja metodologijo za analizo družbenih odnosov. Osredotoča se na povezave med ljudmi, organizacijami in državami. Te vezi se kombinirajo in tvorijo omrežja, ki jih lahko analiziramo z uporabo različnih metod. V družboslovju analiza socialnih omrežij predstavlja močno statistično orodje. Koncepti omrežja so bili opredeljeni, preizkušeni in uporabljeni v mnogih družbenih vedah, od antropologije in sociologije do poslovne administracije in zgodovine (Nooy, Mrvar in Batagelj, 2018). »Tradicionalni pristop k področju je modeliranje mreže z uporabo grafičnih teoretičnih konceptov« (Bruggeman, 2010, str. 194).

(16)

16

»Socialna omrežja imajo dolgo zgodovino na področju družbenih ved. Korenine razmišljanja o socialnih omrežjih najdemo v relacijskih ali strukturnih pristopih k socialni analizi, ki so se razvili v klasični sociologiji« (Scott, 2012, str. 7). En sklop družbene misli je svojo pozornost usmeril na vzorce interakcije in medsebojne povezanosti, preko katerih so posamezniki in družbene skupine med seboj povezani. Drugi teoretiki so pozornost namenili neposrednim osebnim srečanjem, skozi katera se posamezniki med seboj povezujejo in se skozi dejanja teh posameznikov nenehno preoblikujejo. Med slednjimi teoretiki se je pojavil izraz »socialno omrežje« (Wasserman in Faust, 1994).

Področje socialnih omrežij je postalo interdisciplinarno s prispevki raziskovalcev na številnih področjih zunaj družbenih ved, vključno z računalničarji, matematiki in fiziki (Scott, 1991).

Socialna omrežja so pomemben predmet preučevanja za računalniške znanstvenike, ne glede na to, ali jih zanimajo komunikacijska omrežja, kot je internet, omrežja z vsebinami, kot je svetovni splet ali sodobna socialna omrežja, kot sta Twitter ali YouTube (Bruggeman, 2010).

2.2.1 Osnovne lastnosti omrežij

Preden lahko govorimo o metodah analize omrežja, moramo definirati pojem omrežja, kar bomo storili s pomočjo teorije grafov. Graf lahko razumemo kot množico točk in povezav, ki povezujejo pare točk. Točka (ang. vertex) je najmanjša enota v omrežju. Le-ta predstavlja osebe, organizacije, države in podobno. V mojem primeru točka predstavlja vozlišče na spletni strani Imgur. Povezava (ang. line) poteka med dvema točkama v omrežju. Pri analizi socialnih omrežij povezava običajno predstavlja neki družbeni odnos. V mojem omrežju prisotnost povezave med vozliščema pomeni, da se ti dve vozlišči pojavita v kombinaciji na vsaj eni objavi. Vrednost na povezavi pove, kolikokrat se pojavi ta kombinacija v zajetih objavah.

Povezave so lahko usmerjene (ang. arcs) ali neusmerjene (ang. edges). Če bi izvedli anketo med študenti in bi respondente vprašali, od koga si najraje izposojajo zapiske, bi imeli med študenti usmerjene povezave. V mojem omrežju so med vozlišči neusmerjene povezave. Če je v omrežju začetna točka enaka končni, pravimo takšni povezavi zanka (ang. loop). V usmerjenem omrežju so vse povezave v grafu usmerjene, v neusmerjenem omrežju so vse povezave neusmerjene.

Omrežje, ki sem ga ustvaril, je neusmerjeno, saj so vse povezave neusmerjene. Omrežja delimo tudi na mala in velika omrežja ter na redka in gosta omrežja. Mala omrežja imajo po nekaj 10 enot in povezav, velika omrežja po 1000 enot in povezav. Če je v grafu število povezav isto

(17)

17

veliko kot število točk, je omrežje redko, če je število povezav precej večje kot število točk, je omrežje gosto. Moje omrežje je veliko in gosto, saj vsebuje 558 enot in 1542 povezav med enotami. Med povezavami jih ima 1366 vrednost 1, torej se vozlišči pojavita skupaj enkrat na objavi, 176 povezav ima vrednost 2 ali več. Če povzamemo, je omrežje sestavljeno iz grafa in informacij o točkah in povezavah na grafu (Nooy in drugi, 2018).

2.2.2 Pajek

Pajek je program za analizo in vizualizacijo omrežij z več tisoč ali celo milijoni točk. Razvoj programa je motivirala ugotovitev, da obstaja več virov velikih omrežij, ki so že v strojno berljivi obliki. Pajek zagotavlja orodja za analizo in vizualizacijo takšnih omrežij. Mednje spadajo omrežja sodelovanj, organske molekule v kemiji, beljakovinsko-receptorska omrežja interakcij, rodoslovja, internetna omrežja, omrežja citiranj, difuzijske mreže, rudarjenje podatkov in podobno. Glavni cilji programa Pajek so razgradnja velikega omrežja na več manjših omrežij, ki jih je mogoče analizirati z različnim naborom metod, zagotoviti orodja za vizualizacijo omrežja in implementacijo algoritmov za analizo omrežij (Mrvar in Batagelj, 2004). Na Sliki 2.3 vidimo, kako izgleda program Pajek.

(18)

18 Slika 2.3: Program Pajek

2.2.3 Premer

V omrežju lahko med dvema vozliščema obstaja več različnih poti. Posebej nas zanimajo najkrajše poti, ki nam povedo, v najmanj koliko korakih lahko pridemo iz enega vozlišča v drugega. Če si pogledamo primer sporočanja novic, nam najkrajša pot predstavlja potovanje informacij med osebami. Čim krajša je pot, hitreje bo novica dosegla osebo. Najkrajšo pot lahko definiramo po vrednosti ali dolžini poti. Dolžina poti je število povezav na poti med dvema vozliščema, vrednost poti je enaka vsoti vrednosti na povezavah, iz katerih je pot sestavljena.

Premer (ang. diameter) je dolžina najdaljše najkrajše poti v grafu (Mrvar, 2020/2021a).

2.2.4 Stopnja točke

Kohezija pomeni, da socialno omrežje vsebuje veliko število povezav. Več vezi med ljudmi prinaša tesnejšo strukturo, ki je verjetno bolj kohezivna. Pri analizi omrežja gostota omrežja zajema to idejo. To je odstotek vseh možnih povezav v omrežju. Največjo gostoto najdemo v omrežju, v katerem so vsi pari točk povezani z usmerjeno ali neusmerjeno povezavo (Nooy in drugi, 2018).

(19)

19

»Kljub temu gostota omrežja ni zelo uporabna mera, saj je odvisna od velikosti omrežja. Bolje je pogledati število povezav, ki vstopajo ali izstopajo iz posamezne točke, temu pravimo stopnja točke. Točke z visoko stopnjo se bolj verjetno nahajajo v gostih delih omrežja, višja stopnja točk pomeni gostejše omrežje, ker ima vsaka točka več povezav, zato lahko za merjenje strukturne kohezije omrežja uporabimo povprečno stopnjo vseh točk. To je boljše merilo celotne kohezije kot gostota, ker ni odvisno od velikosti omrežja, zato je mogoče primerjati povprečno stopnjo med omrežji različnih velikosti. Pri gostoti in stopnji točke se vrednosti na povezavah ne upoštevajo, saj se gleda samo število povezav« (Nooy in drugi, 2018, str. 75).

V neusmerjenem omrežju je stopnja točke enaka številu točk, ki mejijo na to točko. Takšnim točkam pravimo sosedi. Če se točke dotika 8 povezav bo stopnja točke 8. V usmerjenem omrežju pride do zapleta, ker moramo razlikovati med številom povezav, ki vstopajo v točko, in številom povezav, ki izstopajo iz točke (Mrvar, 2020/2021a). Moje omrežje je neusmerjeno, zato bo stopnja vozlišča enaka številu njegovih sosedov.

2.2.5 Krepke/šibke in dvopovezane komponente

»Točke, ki imajo stopnjo ena ali več, so povezane z vsaj enim sosedom, torej niso izolirane.

Ampak to ne pomeni, da so povezane v celoten kos, saj je omrežje pogostokrat razkosano na več delov. Izolirane dele omrežja lahko obravnavamo kot kohezivne podskupine, ker so točke v odseku med seboj povezane, točke v drugih odsekih pa niso« (Nooy in drugi, 2018, str. 79).

Izpostavil bom tri vrste komponent, to so krepke komponente, šibke komponente in dvopovezane komponente. O krepko povezani komponenti govorimo takrat, ko lahko v neki skupini točk omrežja, ob upoštevanju smeri povezav, pridemo iz vsake točke te skupine v vsako drugo točko iz te skupine. Če se dve točki nahajata znotraj iste krepko povezane komponente lahko rečemo, da sta točki krepko povezani in da med njima obstaja sprehod. Če smeri povezav niso pomembne, govorimo o šibko povezani komponenti. V šibko povezanem omrežju lahko pridemo iz vsake točke do vseh drugih točk, če zanemarimo smeri povezav. Če se dve točki nahajata znotraj iste šibko povezane komponente, rečemo, da sta točki šibko povezani in da med točkama obstaja veriga. Krepka povezanost komponent je bolj omejena kot šibka povezanost. Vsako krepko povezano omrežje je tudi šibko povezano, šibko povezano omrežje pa ni nujno tudi krepko povezano. Omrežje je povezano krepko ali šibko takrat, ko je krepko/šibko povezan vsak par točk znotraj omrežja. V neusmerjenem omrežju povezave nimajo smeri. Posledično obstaja le ena vrsta povezanosti, ki je enakovredna šibki povezanosti

(20)

20

v usmerjenih omrežjih. Z drugimi besedami lahko rečemo, da so krepke komponente enake šibkim komponentam. Takrat jih imenujemo kar komponente (Nooy in drugi, 2018). V neusmerjenem omrežju so komponente ločene med seboj, med točkami iz različnih komponent ni povezav. Moje omrežje je neusmerjeno, krepke komponente bodo enake šibkim komponentam, zato bom v omrežju izračunal samo šibke komponente.

Poleg tega poznamo še dvopovezane komponente. Za primer bom vzel moje neusmerjeno omrežje. Vozlišče »aww« je presečišče omrežja, drugače rečeno artikulacijska točka, če obstajata dve drugi različni vozlišči, recimo »funny« in »awesome«, tako, da vsaka povezava med tema vozliščema vsebuje tudi vozlišče »aww«. To vozlišče bi bilo v tem primeru presečišče omrežja, če bi odstranitev vozlišča iz omrežja povzročila razpad omrežja na dva ali več komponent. Za omrežje lahko pravimo, da je dvopovezano, če se takšen razpad med vozlišči ne more zgoditi, torej ne vsebuje nobenega presečišča. Omrežje je po vozliščih dvopovezano, če pri odstranitvi katerega koli vozlišča iz omrežja ostane povezano (Mrvar, 2020/2021b). Pri dvopovezanih komponentah se zanemarijo smeri povezav (v usmerjenem omrežju), tako kot pri šibko povezanih komponentah. V mojem omrežju je skupina vozlišč dvopovezana komponenta takrat, ko iz vsakega vozlišča te skupine vodita vsaj dve verigi v vsako drugo vozlišče te skupine.

2.2.6 Jedra

Stopnje točk razkrivajo gostoto povezav okoli posameznih točk, vendar nam ne povedo, ali se točke z visoko stopnjo nahajajo skupaj ali so razpršene po vsem omrežju. Pogostokrat nas pri analizi omrežja zanima samo tisti del omrežja, ki je gosto prepleten. Tukaj nastopijo jedra, saj so dober način, da se določa meje omrežja. V velikih omrežjih so jedra zelo učinkovit način iskanja kohezivnih podskupin, saj se lahko pri izračunu jeder omejimo na analizo jeder od določene stopnje naprej in tako izpostavimo samo gosto prepleten del omrežja. Jedra označujejo najmanjšo stopnjo vsake točke v jedru. Pri jedrih nismo pozorni na stopnjo ene točke, ampak na stopnjo vseh točk v skupini. Če ponazorimo s primerom, bi to pomenilo, da 2-jedro vsebuje vse točke, ki imajo stopnjo 2 ali več in so hkrati povezane z vsaj dvoje točkami v jedru. Drugače povedano, skupina točk je 2-jedro, če je vsaka točka iz te skupine povezana z vsaj dvema točkama iz iste skupine. Jedra računamo glede na vhodne ali izhodne povezave. V primeru neusmerjenih omrežij, so vhodna jedra enaka izhodnim jedrom (Nooy in drugi, 2018). Ker je

(21)

21

moje omrežje neusmerjeno, ni pomembno, ali računam vhodna ali izhodna jedra, saj bo rezultat enak v obeh primerih.

2.2.7 Klike

Klike so poseben primer jeder. Skupina točk se imenuje klika, če je vsaka točka iz skupine povezana z vsemi drugimi točkami iz iste skupine (Mrvar, 2020/2021c). Klike so najstrožja strukturna oblika kohezivnih podskupin, so podomrežje z maksimalno gostoto. Predstavljajo torej točke, ki so med seboj zelo močno povezane. Podomrežja, ki vsebujejo samo eno ali dve točki načeloma obstajajo, vendar niso zanimiva za analizo, zato morajo klike vsebovati vsaj tri točke. V velikih omrežjih, kot je moje, je težko izračunati klike, računsko so veliko bolj zahteven postopek kot iskanje jeder. Izvedba analize lahko traja dolgo in celo omrežja, ki niso velika, lahko vsebujejo ogromno klik. Zaradi naštetih razlogov se pogosto omejimo na iskanje manjših klik (Nooy in drugi, 2018).

2.2.8 Triade

Triada je podmnožica treh točk in možnih povezav med njimi. Teorija ravnotežja je prva poučila in spodbudila številne analize triad in še danes se veliko modelov in metod socialnih omrežij osredotoča na analizo triad. Med drugim nas zanima, ali je triada tranzitivna (Wasserman in Faust, 1994). Za primer vzemimo moje omrežje in si izberimo tri poljubna vozlišča, torej triado, in recimo, da izberemo vozlišča »funny, aww, awesome«. Ta triada je tranzitivna, če kadarkoli obstajata povezavi med »funny« in »aww«, ter »aww« in »awesome«, obstaja tudi povezava med »funny« in »awesome«. Nekatere triade ne vsebujejo dovolj povezav, da bi preverili pogoj tranzitivnosti in rečemo, da so tranzitivne na prazno. Triade, ki niso tranzitivne, so lahko bolj ali manj netranzitivne, kar je odvisno od števila povezav, ki manjkajo, da bi izpolnile pogoj tranzitivnosti. Triade se vedno pojavijo v eni od določenih 16 situacij. Označimo jih lahko na dva načina. Lahko jih oštevilčimo s števili od 1 do 16, ali z oznako, ki je sestavljena iz treh števil. Prvo število predstavlja število parov točk z dvosmernimi (ali neusmerjenimi) povezavami, drugo število je število parov točk z enosmernimi povezavami in tretje število predstavlja število nepovezanih parov točk (Mrvar, 2020/2021c). Slika 2.4 prikazuje vseh 16 možnih vrst triad.

(22)

22 Slika 2.4: Možne triade

Vir: Mrvar (2020/2021c, str. 2).

2.2.9 Mere središčnosti

Centralnost oziroma središčnost je eden najstarejših konceptov v analizi omrežij. Večina socialnih omrežij vsebuje ljudi ali organizacije, ki so središčne. Zaradi svojega položaja imajo boljši dostop do informacij in boljše možnosti za širjenje informacij (Nooy in drugi, 2018).

Mere središčnosti se lahko izračunajo za usmerjena ali neusmerjena omrežja, pri usmerjenih povezavah se lahko še dodatno osredotočimo na vhodne in izhodne povezave. Mere središčnosti, ki jih izračunamo za neusmerjena omrežja, lahko izračunamo tudi za usmerjena omrežja, vendar obratno ne drži. V omrežju pravimo, da je točka središčna, če ima visoko stopnjo, je čim bolj dostopna od vseh ostalih točk in se nahaja na največjem možnem številu najkrajših poti vmes med drugimi točkami (Mrvar, 2020/2021d).

(23)

23

2.2.9.1 Degree centrality – mera središčnosti glede na stopnjo

Eden od pristopov k središčnosti temelji na preprosti zamisli, da lahko informacije zlahka pridejo do ljudi, ki so središčni v omrežju. Večje kot je število virov, ki so dostopni osebi, lažje bo pridobiti informacije. Zato je najpreprostejši indikator središčnosti število sosedov, kar predstavlja stopnja točke. Višja kot je stopnja točke, več virov informacij ima na voljo, hitreje bodo informacije prišle do točke, zato je bolj središčna. Stopnje točk ne moremo uporabiti za primerjavo središčnosti z omrežji, ki imajo drugačno število točk, zato te mere običajno normaliziramo. Pri normalizaciji dobimo mero iz intervala med 0 in 1, kjer 0 pomeni najmanjšo možno vrednost in 1 največjo možno vrednost (Nooy in drugi, 2018).

2.2.9.2 Closeness centrality – mera središčnosti glede na dostopnost

»Središčnost glede na stopnjo gleda samo število sosedov točke. Če želimo analizirati strukturo omrežja, moramo vedeti, kdo je s kom povezan v celotnem omrežju. Pozorni moramo biti na posredne vezi, kjer informacije prehajajo iz ene točke do druge in naprej do ostalih točk v omrežju. To nas pripelje do koncepta razdalje v omrežjih, in sicer števila korakov ali posrednikov, potrebnih, da nekdo doseže drugo točko v omrežju« (Nooy in drugi, 2018, str.

153). S konceptom razdalje lahko opredelimo drugo mero središčnosti, to je središčnost glede na dostopnost. Središčnost bližine točke temelji na skupni razdalji med eno točko in vsemi drugimi točkami, kjer večje razdalje dajejo nižje ocene središčnosti. Bližje, kot je točka vsem drugim točkam, lažje bodo informacije prispele do nje in večja bo njena središčnost. Ta mera središčnosti je boljša od središčnosti glede na stopnjo, ker ne upošteva samo neposrednih sosedov neke točke, ampak tudi vse posredne sosede (Mrvar, 2020/2021d).

2.2.9.3 Betwenness centrality – mera središčnosti glede na vmesnost

Stopnja in dostopnost temeljita na dosegljivosti osebe znotraj omrežja. Obstaja še en pristop k središčnosti, ki temelji na ideji, da je oseba bolj središčna, če je pomembnejša od posrednika v omrežju. Ta pristop temelji na konceptu vmesnosti. Središčnost točke v omrežju je odvisna od tega, v kolikšni meri je točka potrebna kot člen v verigah stikov, ki olajšajo širjenje informacij znotraj omrežja. Te točke imajo nadzor nad pretokom informacij v omrežju. Bolj kot je točka vmesna, bolj središčni je njen položaj v omrežju (Nooy in drugi, 2018).

(24)

24

Te tri mere središčnosti lahko vrnejo zelo različne rezultate. Zato moramo biti pri izbiri ustrezne mere zelo previdni, saj se lahko zgodi, da imajo točke sorazmerno nizke stopnje, in hkrati imajo visoko središčnost glede na vmesnost ali dostopnost in obratno (Mrvar, 2020/2021d).

2.2.9.4 Usredinjenost omrežja

Središčnost lahko izračunamo posebej za vsako enoto v omrežju ali celotno omrežje. Mera središčnosti celotnega omrežja se imenuje usredinjenost omrežja. V omrežju z zelo visoko stopnjo usredinjenosti se informacije zlahka širijo, vendar je središče omrežja nepogrešljivo za prenos informacij. Omrežje, ki ima točko, ki glede na središčnost izstopa v primerjavi z drugimi točkami omrežja, je bolj usredinjeno. Če so središčnostne točke zelo izenačene, je usredinjenost omrežja zelo majhna. Mera usredinjenosti zavzema vrednosti od 0 do 1, vrednost 0 pomeni, da so mere središčnostnih točk enake, vrednost 1 pomeni, da ena točka popolnoma dominira ostale točke v omrežju (Mrvar, 2020/2021d).

2.2.10 Kazala in opisi

Poleg stopnje točk, bližine in vmesnosti obstaja še en pogled na središčnost. To so kazala in opisi (ang. hubs and authorities). Osnovna predpostavka tukaj je, da je točka bolj središčna, če ima več stikov in če so le-ti stiki bolj središčni, torej če imajo veliko središčnih stikov. Smer povezav ni pomembna, zato se omenjena metoda središčnosti uporablja tudi za neusmerjena omrežja. Metoda uporablja načelo, da je pomembnost točke odvisna od pomembnosti njenih sosedov. Razlikuje med kazali in opisi (Nooy in drugi, 2018). Točka je dober opis, če nanjo kaže veliko dobrih kazal in je dobro kazalo, če kaže na veliko dobrih opisov (Mrvar, 2020/2021e). V neusmerjenem omrežju ni razlik med kazali in opisi, zato bosta vektorja enaka.

2.2.11 Utežena stopnja

Opisali smo že stopnje točk, kjer stopnja predstavlja število sosedov. Točka, ki je povezana z desetimi drugimi točkami, bo imela stopnjo 10. Poznamo tudi stopnje, pri katerih upoštevamo vrednosti na povezavah, ne pa število povezav. Utežena stopnja se izračuna kot vsota vrednosti na vseh povezavah, ki so povezane s to točko in predstavlja moč točke (Mrvar, 2020/2021e). V primeru mojega omrežja to pomeni, da bo vozlišče, ki je povezano s tremi drugimi vozlišči,

(25)

25

kjer so vrednosti na povezavah 1, 4 in 7 imelo uteženo stopnjo 12. Neutežena stopnja vozlišča bo 3.

2.2.12 Otoki

»V omrežju, kjer poznamo vrednosti na točkah ali povezavah, lahko poiščemo otoke. Otok je največje podomrežje točk, kjer imajo povezave med točkami večjo vrednost, kot povezave, ki niso v podomrežju. Otok si lahko predstavljamo kot lokalni vrh v omrežju, če za njegovo višino uporabimo največjo vrednost povezav, ki se pojavljajo v tej točki. Otok je torej množica točk, dvignjenih nad bližnjo okolico« (Nooy in drugi, 2018, str. 129). Pri točkovnih otokih upoštevamo vrednosti na točkah, pri povezanih otokih upoštevamo vrednosti na povezavah (Mrvar, 2020/2021f).

2.2.13 Metode iskanja skupin

Za prepoznavanje gosto povezanih skupin smo že omenili otoke, ki niso edina metoda za odkrivanje skupin v omrežju. Metoda iskanja skupin (ang. community detection) v omrežju poišče skupine, kjer so povezave znotraj skupin gostejše kot povezave med skupinami. Skupine se identificirajo glede na vrednosti na povezavah, vendar se lahko metoda uporabi tudi za omrežja brez vrednosti. Pajek ponuja dve metodi odkrivanja skupin, metodo Louvain in metodo VOS clustering. Metoda Louvain razdeli točke v skupine z največjo vrednostjo modularnosti.

To je merilo za primerjavo gostote povezav in njihovih vrednosti v skupinah in izven skupin.

VOS clustering je podobna metoda, ki namesto modularnosti uporablja VOS quality function (funkcija kakovosti). Metodi se nekoliko razlikujeta, vendar dajeta podobne rezultate (Nooy in drugi, 2018).

(26)

26

3 Empirični del

3.1 Metodologija

V diplomskem delu bom raziskoval, katere so najbolj relevantne vsebine na spletni strani Imgur. Zajel bom podatke najbolj popularnih objav na spletni strani, ter iz njih narisal omrežje, ki ga bom analiziral s programom Pajek. Omrežje bom analiziral z uporabo različnih metod, kot so vhodne in izhodne stopnje, premer, klike, triade, krepke, šibke in dvopovezane komponente, mere središčnosti, otoki, kazala in opisi, utežene stopnje in podobno. Na podlagi rezultatov bom izbral določena vozlišča in analiziral komentarje, ki se nahajajo v objavah s temi vozlišči.

Z uporabo naštetih metod bom ugotavljal, katere vsebine se najpogosteje pojavljajo na spletni strani in so najbolj relevantne za uporabnike. Raziskal bom, katera so najbolj popularna vozlišča, katere so najpogosteje uporabljene kombinacije vozlišč, katere vrste objav so najbolj popularne, kakšna je prevladujoča politična usmerjenost uporabnikov, kateri so glavni interesi uporabnikov, ali prevladujejo humorne ali resne vsebine, ali si uporabniki nudijo pomoč in podporo in še več. Cilj diplomskega dela je torej, da z uporabo omrežja vozlišč ugotovim, kakšne vrste objav posamezniki radi berejo in objavljajo na spletni strani Imgur.

3.1.1 Hipoteze

V diplomskem delu bom poskušal odgovoriti na naslednje hipoteze, ki sem si jih zastavil pri analizi omrežja vozlišč:

1.) Na spletni strani Imgur prevladujejo humorne/smešne vsebine in objave.

2.) Uporabniki imajo raje objave s slikami in vsebinami živali kot ljudi.

3.) Na spletni strani si uporabniki pogosto nudijo pomoč in podporo v obliki komentarjev na resnih objavah.

4.) Uporabniki spletne strani Imgur so politično v večji meri levo usmerjeni.

(27)

27

3.2 Priprava podatkov za analizo

V diplomskem delu sem se osredotočil na analizo omrežja vozlišč (ang. Tags) na spletni strani Imgur. Za zajetje podatkov sem uporabil Imgurjev vmesnik za programiranje aplikacij (ang.

application programming interface -API). Imgurjev API s standardiziranim programskim vmesnikom izpostavi celotno infrastrukturo spletne strani Imgur. S pomočjo programskega jezika Python sem zajel vsa vozlišča med 600 najbolj popularnimi objavami vsega časa in jih določil kot točke v omrežju. Skoraj vsaka objava vsebuje kombinacijo vozlišč. Te kombinacije so predstavljene kot povezave med vozlišči v omrežju. Večkrat kot se pojavi določena kombinacija dveh vozlišč, večjo vrednost ima njuna povezava. Podatke omrežja sem v Pythonu zapisal v primerno obliko, da lahko omrežje odprem in analiziram v programu Pajek. Postopek zajema podatkov je podrobneje opisan v nadaljevanju.

3.2.1 Imgurjev aplikacijski programski vmesnik

»V današnjem poslovnem okolju je programska oprema postala nepogrešljiva komponenta, le redka podjetja še lahko dosežejo uspeh brez nje. Zato na področju razvoja programske opreme konstantno prihaja do napredkov pri razvoju in preizkušanju različne programske opreme.

Razvijalci nenehno raziskujejo novosti, ki pomagajo procesu razvoja, saj se razvoj programske opreme dojema kot zastrašujočo nalogo, ki zahteva veliko časa in napora. Aplikacijski vmesniki za programiranje so ena izmed novosti na področju razvoja programske opreme« (Ofoeda, Boateng in Effah, 2019, str. 76).

Programski vmesnik, na kratko API, omogoča podjetjem, da zunanjim tujim razvijalcem, poslovnim partnerjem in notranjim oddelkom v svojih podjetjih odprejo funkcije in podatke svojih aplikacij. To storitvam in izdelkom omogoča, da komunicirajo med seboj in izkoristijo podatke in funkcionalnost drug drugega preko dokumentiranega vmesnika. Razvijalcem ni treba vedeti, kako je programski vmesnik implementiran, ampak vmesnik preprosto uporabijo za komunikacijo z drugimi izdelki in storitvami. Uporaba API-jev se je v zadnjem desetletju povečala do te mere, da številne danes najbolj priljubljene spletne aplikacije brez programskih vmesnikov ne bi obstajale (Ofoeda in drugi, 2019). Zato je bistvenega pomena razumeti in ceniti prispevek API-jev k praksi in raziskavam. Slabo razumevanje zasnove in integracije programskih vmesnikov lahko predstavlja velik izziv za podjetja.

(28)

28

Z drugimi besedami je API niz definiranih pravil, ki pojasnjujejo, kako računalniki ali aplikacije komunicirajo med seboj. API-ji se nahajajo med aplikacijo in spletnim strežnikom in delujejo kot vmesni sloj, ki obdeluje prenos podatkov med sistemi. Za primer vzemimo storitev obdelave plačil. Stranke lahko vnesejo podatke o svoji kartici na sprednji strani aplikacije za e-trgovino.

Obdelovalec plačil ne zahteva dostopa do uporabnikovega bančnega računa, saj API ustvari edinstven žeton za to transakcijo in ga vključi v klic API-ja strežniku. To zagotavlja višjo raven varnosti pred morebitnimi vdori. API-ji zagotavljajo, da lahko končna aplikacija naredi samo tisto, kar mora, ne da bi bila izpostavljena občutljivim podatkom ali vdorom.

Imgurjev API preko standardiziranega programskega vmesnika izpostavlja celotno infrastrukturo spletne strani. Z uporabo Imgurjevega API-ja lahko posameznik počne skoraj vse, kar lahko počne na spletni strani Imgur, medtem ko uporablja izbrani programski jezik.

Programski jezik, ki sem ga uporabil v diplomskem delu, se imenuje Python. Za uporabo Imgurjevega API-ja mora vsak posameznik registrirati svojo aplikacijo in prejeti »client_id« in

»client_secret«. Zatem je treba povezati aplikacijo s svojim Imgurjevim računom, s čimer se pridobi žeton za dostop (ang. Access Token). Po registraciji aplikacije in prijave s svojim uporabniškim imenom lahko oseba začne z uporabo programskega vmesnika aplikacije Imgur.

Na podlagi Slike 3.1 vidimo, kako izgleda spletna stran za registracijo aplikacije, Slika 3.2 pa nam prikazuje pridobitev »client_id« in »client_secret«.

(29)

29 Slika 3.1: Registracija aplikacije

(30)

30 Slika 3.2: Client ID, Client secret

3.2.2 Python

Python je eden izmed najbolj priljubljenih in najpogosteje uporabljenih programskih jezikov na svetu. Poleg spletnega razvoja in razvoja programske opreme se Python uporablja za analizo podatkov, razvijanje preprostih video iger, strojno učenje in celo za oblikovanje. Številne največje organizacije na svetu uporabljajo Python v neki obliki. NASA, Google, Spotify, Netflix in nešteto drugih uporabljajo programski jezik Python za pomoč pri oskrbi svojih storitev. Po indeksu TIOBE, ki meri priljubljenost programskih jezikov, je Python trenutno drugi najbolj priljubljeni programski jezik na svetu, prehiteva ga le programski jezik C.

»Poleg svoje osnovne funkcionalnosti se preostanek Pythonovih numeričnih, znanstvenih in grafičnih zmožnosti doseže z naložljivimi moduli, znanimi kot paketi. Ti paketi se lahko prenesejo iz interneta in namestijo na inštalirano različico Pythona« (Shukla in Parmar, 2016, str. 278). Za zajem podatkov sem naložil in inštaliral številne pakete, kot so Matplotlib, NumPy, Pandas, Imgurpython, NetworkX in CSV. Matplotlib je 2D paket za risanje. Uporabniku omogoča interaktivno vizualizacijo podatkov, kakovostno oblikovanje številk in grafov.

NetworkX je paket za ustvarjanje, manipulacijo in proučevanje strukture, dinamike in funkcij

(31)

31

kompleksnih omrežij. Z uporabo teh dveh paketov sem v Pythonu narisal omrežje, da sem preveril, ali je bil zajem podatkov uspešen. Izris omrežja je prikazan na Sliki 3.3.

Slika 3.3: Izris omrežja v Pythonu (narisane prve dve strani objav za boljšo preglednost)

Numerični Python (NumPy) je pomemben paket za izboljšanje zmogljivosti v Pythonu.

Dopolnjuje Pythonove izvorne vrste podatkov in omogoča hitro ter učinkovito obdelavo velike količine podatkov. Skoraj vsak znanstvenik, ki dela v Pythonu, se opira na moč paketa NumPy.

Prinaša računsko moč programskih jezikov, kot sta C in Fortran, v programski jezik Python, ki se ga je veliko lažje naučiti in uporabljati (Shukla in Parmar, 2016). Pandas je odprtokodno orodje, ki je hitro, zmogljivo, prilagodljivo in enostavno za uporabo. Uporablja se za analizo in manipulacijo podatkov, zgrajeno je na osnovi programskega jezika Python. Imgurpython je vmesnik do spletnega API-ja strani Imgur. Brez njega ne moremo upravljati z API-jem. Tako imenovana oblika CSV (vrednosti, ločene z vejico) je najpogostejša oblika uvoza in izvoza za preglednice in zbirke podatkov. Modul CSV implementira razrede za branje in pisanje tabelarnih podatkov v obliki CSV. Programerjem omogoča, da v programu zapišejo različne ukaze, ki pravijo, da se določeni podatki zapišejo v obliki, ki jo zahteva Excel, Pajek ali kateri drug program. S CSV modulom lahko programerji preberejo tudi podatke iz različnih vrst datotek.

Paket Imgurpython sem uporabil, da sem dostopal do Imgurjevega aplikacijskega programskega vmesnika. Numerični Python in Pandas sem uporabil za podatkovni okvir, CSV

(32)

32

modul pa za izpis podatkovnih okvirov v .net datoteko, ki je pogoj, da lahko odprem podatke v programu Pajek.

Slika 3.4: Koda za zajem podatkov in izris omrežja v Pythonu

Sprva sem zapisal kodo, kjer sem zajel podatke iz Imgurja in narisal omrežje v Pythonu. Koda je prikazana na Sliki 3.4. V kodi sem najprej uvozil module, izpisal sem »client_id« in

»client_secret«, ter podatke posredoval Imgurju, da sem dobil dostop do API-ja. Potem sem zapisal konstanto, ki določi, koliko strani objav bom zajel. Določil sem 10 strani, kar predstavlja približno 600 objav. Ustvaril sem dve galeriji, kjer sem zajel vozlišča in kombinacije vozlišč na objavi. Za vsako stran, iz katere sem črpal objave, sem določil razvrstitev objav po najbolj popularnih objavah vseh časov, saj se po privzetih nastavitvah prikazujejo samo trenutno najbolj popularne objave. Zatem sem izračunal vrednost povezave, kjer število na povezavi pomeni kolikokrat sta se dve vozlišči pojavili v kombinaciji in na koncu se izriše že prej prikazano omrežje.

(33)

33 Slika 3.5: Uvoz preostalih modulov

Slika 3.6: Koda za zajem podatkov in kreacijo omrežja v Pajku

Zatem sem zapisal še kodo, ki je podatke preoblikovala v primerno obliko in jih shranil v .net datoteko. Uvozil sem preostale potrebovane module, kar lahko vidimo na Sliki 3.5. Na podlagi Slike 3.6 vidimo, da je prva polovica kode identična prejšnji, kjer sem zajel podatke o kombinaciji vozlišč iz Imgurja. V drugi polovici kode sem izpisal seznam vozlišč in vozliščem določil identifikacijske vrednosti. Zapisal sem tabele, kjer so v prvem stolpcu indeksi vozlišč

(34)

34

in v drugem stolpcu imena vozlišč. Ustvaril sem seznam neusmerjenih povezav, izpisal točke, ki jih predstavljajo vozlišča, ter izpisal tabelo vozlišč v CSV formatu. Označil sem povezave v grafu, ki ustrezajo kombinacijam vozlišč.

V kodi so vrednosti na povezavah normalizirane, s čimer vidim relativno povezanost vozlišč.

Normalizirane vrednosti sem dobil tako, da sem delil število galerij, kjer vozlišči nastopata skupaj, s korenom od števila galerij, kjer nastopa prvo vozlišče, pomnoženo s številom galerij, kjer nastopa drugo vozlišče. Normalizirani podatki imajo na povezavah vrednosti med 0 in 1, kjer 0 pomeni, da vozlišča nikoli ne nastopata skupaj, 1 pomeni, da vozlišča vedno nastopata skupaj. Dve vozlišči, ki sama po sebi nista popularna (prvi recimo nastopi v 10 galerijah, drugi v 20 galerijah), ampak sta skupaj v 7 galerijah, sta za nas bolj povezana, kot vozlišči, ki sta popularna (prvi nastopa v 100 galerijah, drugi v 300 galerijah), skupaj pa relativno gledano redko nastopata (recimo v 23 galerijah). V prvem primeru bi bila vrednost na povezavi 0.49, v drugem 0.13, kar nam pokaže, da sta vozlišča v prvem primeru res bolj povezana.

Vrednosti na povezavah sem želel imeti še nenormalizirane, zato sem naredil majhno spremembo in še enkrat pognal kodo, da sem dobil nenormalizirane podatke, kjer vrednosti nisem delil. Sprememba v kodi je prikazana na Sliki 3.7. S tem sem ustvaril dve omrežji, v enem so vrednosti na povezavah normalizirane, v drugem nenormalizirane. V nenormaliziranih podatkih nam vrednost na povezavi pove, kolikokrat sta se vozlišči pojavili skupaj na objavi.

Slika 3.7: Nenormalizirane vrednosti povezav

Na koncu sem izpisal tabelo povezav v primerni obliki, da sem jo lahko odprl v programu za analizo omrežij Pajek.

(35)

35 Slika 3.8: Omrežje vozlišč v programu Pajek

V omrežju se nahaja 558 različnih vozlišč in 1542 povezav med vozlišči. Za boljšo preglednost sem uporabil energijsko risanje Kamada-Kawai.

Slika 3.9: Urejeno omrežje vozlišč

Originalno omrežje vozlišč je prikazano na Sliki 3.8, urejeno omrežje vozlišč vidimo na Sliki 3.9.

(36)

36

3.3 Rezultati analize

3.3.1 Premer

Omrežja z zelo velikim številom točk imajo pogostokrat kratke najkrajše poti med točkama.

Povprečna dolžina najkrajše poti WWW omrežja, ki ima več kot 800 milijonov točk, je 18.59 (Albert, Jeong in Barabasi, 1999). To velja tudi v mojem primeru. Premer omrežja je 6, in sicer na najdaljši najkrajši poti med vozliščema »notreally« in »freedom«.

Slika 3.10: Najdaljši najkrajši poti med »notreally« in »freedom« glede na dolžino

Na podlagi Slike 3.10 vidimo, da obstaja več možnih najdaljših najkrajših poti med vozliščema z dolžino 6. V podomrežju je skupno 14 vozlišč in 20 povezav. Prav tako ni prisotnih zank.

(37)

37

Slika 3.11: Najdaljši najkrajši poti med »notreally« in »freedom« glede na vrednost

Najkrajšo pot sem definiral še glede na vrednost poti, kar je prikazano na Sliki 3.11. Če bi bile vrednosti na povezavah enake 1, bi bila vrednost poti enaka dolžini poti (Mrvar, 2020/2021a).

To v mojem primeru delno drži, nekatere vrednosti se razlikujejo, druge ne. Uporabil sem vrednosti nenormaliziranih podatkov. Iz slike vidimo, da sta dve možni poti. Najdaljše najkrajše poti imajo vrednost 6, vendar jih je manj, kot v primeru dolžine poti. V podomrežju je skupno 8 vozlišč in 8 povezav, ter prav tako ni prisotnih zank. Vrednost poti je enaka dolžini poti.

3.3.2 Stopnje vozlišč

Povprečna stopnja vozlišč v omrežju je 5.5, kar pomeni, da ima vsako vozlišče povprečno 5.5 povezav s sosednjimi vozlišči.

(38)

38 Slika 3.12: Omrežje glede na stopnjo vozlišč

Na podlagi Slike 3.12 vidimo različne barve glede na stopnjo vozlišč. Na dnu omrežja so vozlišča svetlo modre barve s stopnjo 0, kar pomeni, da se nikoli ne pojavijo v kombinaciji z drugimi vozlišči. Ta vozlišča so bila edina vozlišča na objavi. Prav tako vidimo na dnu in na sredini omrežja več vozlišč rumene barve, ki imajo stopnjo 1, torej se pojavijo s samo enim vozliščem v kombinaciji. Poleg njih vidimo vozlišča rdeče barve s stopnjo 3 in desno zgoraj vidimo vozlišča temno modre barve s stopnjo 4. Vozlišča z najvišjimi stopnjami se nahajajo v sredini omrežja. Zaradi velikosti in gostote omrežja so na sliki vozlišča z visokimi stopnjami slabo razvidna, zato sem izpisal frekvenčno porazdelitev stopenj vozlišč.

(39)

39 Slika 3.13: Frekvenčna porazdelitev stopenj

Iz Slike 3.13 lahko razberemo, da je v omrežju 12 vozlišč s stopnjo 0, med katere spada vozlišče

»help«. Največ vozlišč ima stopnjo 4, teh je kar 203. Mednje spada vozlišče »shiny«. Nas najbolj zanimajo vozlišča z najvišjimi stopnjami. Vozlišče »funny« ima stopnjo 132, torej se v kombinaciji pojavi vsaj enkrat s 132 različnimi vozlišči. Z vozliščem »funny (smešno)« se označujejo humorne objave. To vozlišče ima daleč najvišjo stopnjo, iz česar lahko sklepamo, da je velik del vsebin na spletni strani humornih. Temu sledi vozlišče »awesome (super)« s stopnjo 92. S tem vozliščem se označujejo objave z naslovi, kot so »24 izjemnih spretnosti za

(40)

40

učenje brezplačno na spletu, super spletna mesta, s katerimi lahko izgubljate čas, 16 super vadnic za Photoshop« in podobno. Večina najbolj popularnih objav, označenih s tem vozliščem, so neke vrste priročniki za pomoč uporabnikom. Temu sledijo objave oseb, ki naredijo nekaj izjemnega ali neverjetnega, kot je hoja po žici. Vozlišče s tretjo najvišjo stopnjo je »current events (trenutni dogodki)«, v kombinaciji se pojavi s 74 drugimi vozlišči. Z vozliščem se označujejo objave, ki se nanašajo na svetovne novice in trenutne pomembne dogodke.

Pogledal sem še stopnje na povezavah med temi tremi vozlišči. Vozlišča »funny« in »awesome«

se v kombinaciji pojavita 30-krat, z normalizirano vrednostjo 0.28. Z vozliščem »current events« se oba pojavita samo 4-krat, z normalizirano vrednostjo 0.06. Na podlagi tega lahko sklepam, da so na prvi pogled najbolj priljubljene humorne vsebine, vendar imajo uporabniki spletne strani radi raznolike vsebine. Vozlišče »current events« se z vozliščem »funny« zelo redko pojavi v kombinaciji, objave se nanašajo na bolj resne vsebine. Vozlišče »awesome« se večkrat pojavi v kombinaciji s »funny«, vendar če upoštevamo normalizirano vrednost ugotovimo, da vozlišči nista zelo povezani. Najbolj popularna vozlišča niso tako zelo povezana, kot sem pričakoval, iz česar sklepam, da imajo uporabniki spletne strani Imgur radi različne vrste objav. Iz slike vozlišč z najvišjimi stopnjami lahko zasledimo tudi vozlišča »aww, dog, cat, cute«, kar nakazuje na pogostost objav s slikami živali. Vozlišča »trump, fucktrump, politics, vote« kažejo na popularnost političnih objav.

3.3.3 Krepke/šibke in dvopovezane komponente

Moje omrežje je neusmerjeno, zato so krepke in šibke komponente enake. Izračunal sem šibke komponente v omrežju in dobil 43 različnih komponent. Zatem sem izračunal še frekvenčne porazdelitve komponent.

(41)

41 Slika 3.14: Prikaz komponent

(42)

42 Slika 3.15: Frekvenčne porazdelitve komponent

Na podlagi Slik 3.14 in 3.15 je razvidno, da je v omrežju 43 komponent. Vsaka komponenta je obarvana s svojo barvo. V največji komponenti je 442 vozlišč, obarvana je z rumeno barvo in predstavlja najgostejši del omrežja. Ta komponenta zajema kar 79.2 % vseh vozlišč v omrežju.

12 komponent je sestavljenih iz samo enega vozlišča, 11 komponent iz dveh vozlišč in 13 komponent iz treh vozlišč. Te komponente lahko vidimo na spodnjem delu slike omrežja. 5 komponent je sestavljenih iz štirih vozlišč in 7 komponent iz petih vozlišč. Te komponente so zopet vidne na dnu slike in v zgornjem desnem kotu. Druga največja komponenta je sestavljena iz 9 vozlišč, obarvana je z rdečo barvo in se nahaja desno od največje komponente. Ta komponenta vsebuje vozlišča »maps, geography, cartography, united states, singapore« in podobno, iz česar sklepam, da se nanaša na potovalne vsebine. Rezultati so takšni, kot bi pričakoval, saj je bilo že iz prvotne slike razvidno, da je v omrežju veliko vozlišč med seboj gosto povezanih, nekaj vozlišč pa zelo redko povezanih. Gosta skupina vozlišč je največja komponenta, ki vsebuje večino vozlišč v omrežju. Če pogledamo še nenormalizirane vrednosti

(43)

43

povezav vidimo, da se samo v največji komponenti pojavljajo vrednosti na povezavah, ki so večje od 1. V vseh ostalih komponentah so vse vrednosti 1, kar pomeni, da se v kombinaciji z vozlišči pojavijo samo enkrat. Ker smer povezav med vozlišči ni pomembna, vidimo, da znotraj komponent pridemo iz vsakega vozlišča skupine v vsako drugo vozlišče iz iste skupine.

Slika 3.16: Del hierarhije in del artikulacijskih točk

Seznami so preveliki, da bi pokazal celotno hierarhijo in celoten seznam artikulacijskih točk, zato sem na Sliki 3.16 zajel samo en del podatkov. Omrežje je sestavljeno iz 96 dvopovezanih komponent, največja komponenta vsebuje 295 vozlišč. To je daleč največja dvopovezana komponenta, naslednja največja komponenta vsebuje samo 6 vozlišč. Vse ostale med 2 in 5 vozlišč. Obstaja več artikulacijskih točk, ki bi ob odstranitvi povzročile razpad omrežja na več delov. Iz slike je razvidno, da mednje spadajo artikulacijske točke »aww«, ki bi povzročile razpad omrežja na 3 dele, »current events«, kjer bi omrežje razpadlo na 6 delov in »funny«, ki bi med vsemi artikulacijskimi točkami povzročil razpad na največ delov, in sicer na 9. Še dve artikulacijski točki, ki bi povzročili razpad omrežja na veliko delov, sta »memes« (5 delov) in

»mildly interesting« (4 dele). Poleg tega obstaja več artikulacijskih točk, ki bi povzročile razpad omrežja na 3 ali 2 dele. Le-teh je skupno okoli 30. Če primerjamo artikulacijske točke z vozlišči z najvišjimi stopnjami, vidimo, da bi nekatera povzročila razpad omrežja na veliko delov

(44)

44

(»funny, current events«), druga pa samo na 2 dela (»awesome«). Iz tega lahko sklepam, da visoka stopnja vozlišča ne pomeni nujno tudi tega, da se vozlišče velikokrat pojavi v vlogi presečišča omrežja.

Slika 3.17: Največja dvopovezana komponenta

Na podlagi Slike 3.17 vidimo, da največja dvopovezana komponenta med drugim vsebuje vozlišča z največjimi artikulacijskimi točkami in največjimi stopnjami. V primeru odsotnosti kateregakoli vozlišča to podomrežje ostane povezano.

3.3.4 Jedra

Zaradi neusmerjenosti omrežja zopet ni pomembno, ali izračunam jedra glede na vhodne povezave ali izhodne povezave.

(45)

45 Slika 3.18: Frekvenčna porazdelitev jeder

Iz frekvenčne porazdelitve jeder na Sliki 3.18 vidimo, da je najgostejši del omrežja 9-jedro, v katerem se nahaja 16 vozlišč. Z drugimi besedami lahko rečemo, da imamo 16 vozlišč, ki se pojavljajo v kombinaciji na objavah z vsaj devetimi vozlišči izmed teh 16 vozlišč.

Slika 3.19: Jedro najvišje stopnje

V jedru najvišje stopnje, ki ga prikazuje Slika 3.19, se nahajajo vozlišča »funny, awesome, current events, aww, memes, reaction, wholesome, dog, creativity, unmuted, mildly interesting, staff picks, story time, yearinreview2020, dog, the more you know«. Če pogledamo vrednosti nenormaliziranih povezav med vozlišči, lahko zasledimo, da se največkrat pojavita v

(46)

46

kombinaciji vozlišča »aww« in »awesome«, in to kar 34-krat. Vozlišče »awesome« se pojavi tudi 31-krat v kombinaciji z vozliščem »reaction« in 30-krat z vozliščem »funny«. Čeprav ima vozlišče »funny« najvišjo stopnjo oz. največ sosedov, se vozlišče »awesome« večkrat pojavlja v kombinaciji s svojimi sosedi znotraj najgostejšega dela omrežja. Če pogledamo še normalizirane vrednosti med temi vozlišči, vidimo, da ima vozlišče »awesome« vrednost 0.41 z vozliščem »aww«, z vozliščem »reaction« 0.44 in vozliščem »funny« 0.28. Iz tega sklepamo, da relativno gledano vozlišče »awesome« bolj redko nastopa z vozliščem »funny« kot z drugima dvema vozliščema. Vsebinsko gledano so si vozlišča precej različna. Nekatera se navezujejo na živali, druga na humorne vsebine, tretja na novice in trenutne dogodke. Določena vozlišča govorijo o zgodbah in dogodkih, ki so se pripetili uporabniku, nekatera o zanimivih in poučnih stvareh. Posamezna vozlišča se v kombinaciji z ostalimi vozlišči pojavijo mnogokrat, nekatera skoraj nikoli. Vse to mi sporoča, da imajo uporabniki radi širok nabor različnih vsebin, kjer bi samo na podlagi jeder s težavo določil, katera vsebina prevladuje na spletni strani.

3.3.5 Klike

Pri izračunu klik sem poiskal vse klike na treh, štirih in petih vozliščih. Klik na treh vozliščih v omrežju je 2004, klik na štirih vozliščih je 1622 in klik na petih vozliščih je 978. Izračun klik na šestih vozliščih je bil že računsko prezahteven postopek in ga program ni zmogel izvesti.

(47)

47 Slika 3.20: Klike na 5 vozliščih

Rečemo lahko, da v omrežju obstaja 978 podmnožic petih vozlišč, v katerih je vsako vozlišče iz podmnožice povezano z vsemi drugimi vozlišči iz iste podmnožice. To je prikazano na Sliki 3.20. Ta vozlišča so med seboj močno povezana v najbolj popularnih vsebinah na spletni strani Imgur. Na spodnjem delu omrežja vidimo izolirane klike različnih vsebin. Nekatere vsebine so resne in govorijo o raku (»breastcancer, chemotherapy«), poleg njih so klike, ki govorijo o brezdomstvu in samomorilnosti (»suicidal, homeless«). Nekatere vsebine so humorne in se vsebinsko nanašajo na hitro hrano (»mcdonalds, burgerking«), spet druge so politične in najverjetneje levo usmerjene (»traitor trump, dumb trump«). Na sredini omrežja vidimo gosto povezane klike, kjer se med drugim nahajata že prej omenjena vozlišča »funny« in »awesome«.

Kot smo že večkrat do sedaj videli, so vsebine zelo raznolike.

(48)

48

Slika 3.21: Del števila nastopov znotraj klik – urejeno od največje vrednosti navzdol

Zaradi velikosti seznama nastopov v klikah sem na Sliki 3.21 prikazal samo en del seznama.

Na podlagi slike je razvidno, da vozlišče »funny« nastopa v največ klikah, in sicer v 463. Sledi mu vozlišče »awesome«, ki nastopa v 433 klikah, vozlišče »reaction« v 379 klikah, ter vozlišči

»aww« in »the more you know« v 355 in 314 klikah. Za omenjena vozlišča lahko trdimo, da so najbolj povezana z ostalimi vozlišči. Ob pregledu frekvenčnih porazdelitev ugotovimo, da večina vozlišč ni prisotnih v nobeni kliki (228 vozlišč) ali samo v eni kliki (224 vozlišč). Glede na klike so najbolj povezana vozlišča zopet ta, ki se v vseh izračunih najpogosteje pojavljajo.

So mešanica lepih, humornih, informativnih, poučnih in zanimivih vsebin.

Reference

POVEZANI DOKUMENTI

Diplomsko delo je rezultat lastnega dela. Spodaj podpisani se strinjam z objavo svojega diplomskega dela na spletni strani Digitalne knjižnice Biotehniške

Diplomsko delo je rezultat lastnega raziskovalnega dela. Podpisani se strinjam z objavo svoje naloge v polnem tekstu na spletni strani digitalne knjižnice

Delo je rezultat lastnega raziskovalnega dela. Podpisana se strinjam z objavo svoje diplomske naloge v polnem tekstu na spletni strani Digitalne knjižnice Biotehniške

Na vrh tega seznama lahko pridemo z učinkovito uporabo optimizacije na spletni strani, kjer urejamo notranje elemente spletne strani in s pridobivanjem zunanjih povezav (povezave

− da so informacije objavljene na spletni strani izbranega študentskega servisa tudi zelo pomemben dejavnik zaznavanja kakovosti s strani anketiranih članov, saj jih

Pričakovani učni izidi so sestavina študijskega programa in so objavljeni na spletni strani doktorskega študijskega programa Bioznanosti (www.bioznanosti.si). Na tej

Do Radovljice in Kranja so iz posameznih krajev povezave zagotovljene z rednimi odhodi, ki so objavljeni na spletni strani Arriva/Alpetour.. Povratek

Omenili smo, da za prodajo uporabljamo dve loˇ ceni spletni strani, ki pokrivata mednarodni in ameriˇski trg, zato bi lahko cene doloˇ cali glede na to, s katere spletne strani je