• Rezultati Niso Bili Najdeni

ODKRIVANJE REDKIH PATOLOŠKIH SPREMEMB V KANDIDATNIH GENIH ZA MULTIPLO SKLEROZO

N/A
N/A
Protected

Academic year: 2022

Share "ODKRIVANJE REDKIH PATOLOŠKIH SPREMEMB V KANDIDATNIH GENIH ZA MULTIPLO SKLEROZO"

Copied!
66
0
0

Celotno besedilo

(1)

BIOTEHNIŠKA FAKULTETA ŠTUDIJ BIOTEHNOLOGIJE

Aleksander TURK

ODKRIVANJE REDKIH PATOLOŠKIH SPREMEMB V KANDIDATNIH GENIH ZA

MULTIPLO SKLEROZO

MAGISTRSKO DELO Magistrski študij - 2. stopnja

Ljubljana, 2021

(2)

ŠTUDIJ BIOTEHNOLOGIJE

Aleksander TURK

ODKRIVANJE REDKIH PATOLOŠKIH SPREMEMB V KANDIDATNIH GENIH ZA MULTIPLO SKLEROZO

MAGISTRSKO DELO Magistrski študij - 2. stopnja

DISCOVERING RARE PATHOLOGICAL CHANGES IN CANDIDATE GENES FOR MULTIPLE SCLEROSIS

M. SC. THESIS Master Study Programmes

Ljubljana, 2021

(3)

Magistrsko delo je zaključek Magistrskega študijskega programa druge stopnje Biotehnologija. Delo je bilo opravljeno na Kliničnem Inštitutu za Genomsko Medicino Univerzitetnega Kliničnega Centra Ljubljane in na Biotehniški Fakulteti Univerze v Ljubljani.

Študijska komisija je za mentorja magistrskega dela imenovala prof. dr. Borut Peterlina in za somentorico prof. dr. Tanjo Kunej.

Komisija za oceno in zagovor:

Predsednica: prof. dr. Mojca NARAT

Univerza v Ljubljani, Biotehniška fakulteta, Oddelek za zootehniko Član: prof. dr. Borut PETERLIN

Univerzitetni Klinični Center Ljubljana, Klinični Inštitut za Genomsko Medicino

Članica: prof. dr. Tanja KUNEJ

Univerza v Ljubljani, Biotehniška Fakulteta, Oddelek za zootehniko Član: prof. dr. Marko KREFT

Univerza v Ljubljani, Biotehniška Fakulteta, Oddelek za biologijo

Datum zagovora:

(4)

KLJUČNA DOKUMENTACIJSKA INFORMACIJA ŠD Du2

DK UDK 606:616.8:575.112(043.2)

KG bioinformatika, GWAS, multipla skleroza, pot Wnt, redke patološke spremembe AV TURK, Aleksander

SA PETERLIN, Borut (mentor)

KZ SI-1000 Ljubljana, Jamnikarjeva 101

ZA Univerza v Ljubljani, Biotehniška fakulteta, Študij biotehnologije, Magistrski študijski program druge stopnje Biotehnologija

LI 2021

IN ODKRIVANJE REDKIH PATOLOŠKIH SPREMEMB V KANDIDATNIH GENIH ZA MULTIPLO SKLEROZO

TD Magistrsko delo (Magistrski študij - 2. stopnja) OP VIII, 45 str., 6 pregl., 9 sl., 103 vir.

IJ sl JI sl/en

AI Multipla skleroza (MS) je nevrodegenerativna bolezen z okoljskimi in genetskimi dejavniki tveganja, vendar je njena etiologija slabo razumljena. Izvedene so bile že številne študije s pristopom GWAS (angl. genome-wide association study), vendar potrebujemo zanesljivejše označevalce na podlagi redkih genetskih različic. Z namenom boljšega razumevanja genetskih dejavnikov MS je bilo predhodno izvedeno eksomsko sekvenciranje pri treh skupinah preiskovancev: bolnikih z družinsko obliko MS, bolnikih s sporadično obliko in kontrolni skupini. V analizo smo zajeli različice nukleotidnega zaporedja v 938 genih, ki so bili z MS predhodno povezani s pristopom GWAS. Kriteriji za izbor genskih različic so bili naslednji: 1.

frekvenca manj pogostega alela (angl. minor allele frequency; MAF) < 0,05, 2.

ocena orodja CADD (angl. Combined annotation dependent depletion) ≥ 20 ter 3.

odsotnost različice v kontrolni skupini in prisotnost pri vsaj eni skupini bolnikov.

Tem pogojem je ustrezalo 25 različic nukleotidnega zaporedja v 19 genih. Med njimi je pet genov vsebovalo več kot eno redko različico; gen SORBS2 je vseboval tri različice, medtem ko so AGAP2, CLEC16A, ELMO1 in RREB1 vsebovali dve različici. Z orodjema STRING in Enrichr smo ugotovili, da je teh 19 genov obogatenih v bioloških poteh, ki so povezane z MS, imunskim sistemom in avtoimunskimi boleznimi. Pet od 19 genov je povezanih z biološko potjo Wnt, in sicer: AHI1, AGAP2, KCNMA1, TCF7 in TNKS. Z odkrivanjem redkih patoloških različic smo v tej raziskavi izpostavili zanesljivejše kandidatne gene za razvoj MS in s tem prispevali k razvoju diagnostičnih tehnik v prihodnosti. Vlogo kandidatnih genov pri razvoju MS bo potrebno preveriti z dodatnimi funkcionalnimi analizami.

(5)

KEY WORDS DOCUMENTATION ND Du2

DC UDC 606:616.8:575.112(043.2)

CX bioinformatics, GWAS, multiple sclerosis, rare pathological changes, Wnt pathway AU TURK, Aleksander

AA PETERLIN, Borut (supervisor) PP SI-1000 Ljubljana, Jamnikarjeva 101

PB University of Ljubljana, Biotechnical Faculty, Master Study Programme in Biotechnology

PY 2021

TI DISCOVERING RARE PATHOLOGICAL CHANGES IN CANDIDATE GENES FOR MULTIPLE SCLEROSIS

DT M. Sc. Thesis (Master Study Programmes) NO VIII, 45 p., 6 tab., 9 fig., 103 ref.

LA sl AL sl/en

AB Multiple sclerosis (MS) is a neurodegenerative disease of unclear etiology with both environmental and genetic risk factors. Multiple genome wide association studies (GWAS) have been conducted, however it is necessary to identify more reliable disease markers based on rare genetic variants. For the purpose of better understanding its genetic risk factors exome sequencing was conducted beforehand - probands were divided into three groups: patients with familial MS, sporadic MS and the control group. The analysis included nucleotide variants of 938 genes previously associated with MS using GWAS. These genes were analyzed for rare gene variants based on the following criteria: minor allele frequency (MAF) < 0.05, CADD (combined annotation dependent depletion) score ≥ 20 and absence from the control group with simultaneous presence in at least one group with MS. We determined 25 variants located in 19 genes that fit the criteria. Among them five genes contained more than one rare gene variant – SORBS2 contained three rare variants while AGAP2, CLEC16A, ELMO1 and RREB1 contained two variants each. Using the STRING and Enrichr tools we found that these 19 genes were enriched in biological pathways associated with MS, the immune system and autoimmune diseases. Five of the 19 genes were connected to the Wnt biological pathway: AHI1, AGAP2, KCNMA1, TCF7 and TNKS. With the discovery of rare pathological variants we have contributed to the understanding of MS' genetic components and with it to the development of potential future diagnostic methods.

The role of candidate genes in the development of MS requires further research via functional analyses.

(6)

KAZALO VSEBINE

Str.

KLJUČNA DOKUMENTACIJSKA INFORMACIJA III

KEY WORDS DOCUMENTATION IV

KAZALO VSEBINE V

KAZALO PREGLEDNIC VII

KAZALO SLIK VIII

1 UVOD 1

1.1 OPREDELITEV PROBLEMA 1

1.2 NAMEN IN POVOD DELA 2

1.3 HIPOTEZE 2

2 PREGLED OBJAV 3

2.1 DEDNOST MULTIPLE SKLEROZE 3

2.2 POJAVNOST BOLEZNI PO POPULACIJAH 3

2.3 OKOLJSKI DEJAVNIKI ZA RAZVOJ MULTIPLE SKLEROZE 5

2.3.1 Zemljepisna širina 5

2.3.2 Vitamin D 5

2.3.3 Okužba z virusom Epstein-Barr 6

2.3.4 Kajenje 7

2.4 GENETSKI DEJAVNIKI ZA RAZVOJ MULTIPLE SKLEROZE 7

2.4.1 Lokus MHC 8

2.4.2 Interlevkini 8

2.4.3 Biološka pot JAK/STAT 9

2.4.4 Biološka pot NF-κB 9

2.4.5 Redke genske različice 10

2.5 EPIGENETSKI DEJAVNIKI ZA RAZVOJ MULTIPLE SKLEROZE 10

2.5.1 Metilacija DNA 11

2.5.2 Post-translacijske modifikacije histonov 11

2.5.3 Nekodirajoče RNA 12

2.6 BIOINFORMACIJSKA ORODJA 12

2.6.1 CADD 12

2.6.2 STRING 13

2.6.3 Enrichr 13

3 MATERIAL IN METODE 14

(7)

4 REZULTATI 16

4.1 ANALIZA REZULTATOV EKSOMSKEGA SEKVENCIRANJA 16

4.2 ANALIZA INTERAKCIJ GENOV IN OBOGATITVENA ANALIZA 20

4.3 PREGLED FUNKCIJ GENOV, KI USTREZAJO KRITERIJEM IZBORA 28

5 RAZPRAVA 33

6 SKLEPI 42

7 POVZETEK 44

8 VIRI 46

ZAHVALA

(8)

KAZALO PREGLEDNIC

Str.

Preglednica 1: Prevalenca MS v Evropskih državah prikazana s številom bolnikov z MS na

100000 prebivalcev 4

Preglednica 2: Biološke funkcije, število različic in imena genov, ki so ustrezali kriterijem

izbire, pri bolnikih z družinsko obliko MS 19

Preglednica 3: Biološke funkcije, število različic in imena genov, ki so ustrezali kriterijem

izbire, pri bolnikih s sporadično obliko MS 19

Preglednica 4: Funkcionalne obogatitve odkrite z orodjem STRING za 19 genov, ki so

ustrezali kriterijem izbora 23

Preglednica 5: Študij, ki v povezavi z MS opisujejo gene in interakcijske partnerje genov,

ki so v tej študiji ustrezali kriterijem izbire 36

Preglednica 6: Preglednica trenutno poznanih bioloških funkcij za 19 genov, povezanih z

MS, v katerih se nahajajo redke genske spremembe 39

(9)

KAZALO SLIK

Str.

Slika 1: Grafični pregled korakov raziskave predhodno opravljenih predhodno na KIGM in

korakov opravljenih v okviru te študije 16

Slika 2: Preglednica rezultatov analize z naborom vseh genov, ki so ustrezali kriterijem izbora, povezanih z MS in njihovih genskih različic v programu Microsoft Excel 18 Slika 3: Mreža proteinskih interakcij STRING za izbrane gene pri bolnikih z družinsko

obliko MS 20

Slika 4: Mreža proteinskih interakcij STRING za izbrane gene pri bolnikih s sporadično

obliko MS 21

Slika 5: Mreža proteinskih interakcij STRING za izbrane gene pri bolnikih s sporadično in

družinsko obliko MS 22

Slika 6: Obogatitve zbranih 19 genov v genskih zbirkah BioPlanet (2019) in WikiPathways Human (2019) prikazano s stolpičnim grafikonom orodja Enrichr 24 Slika 7: Obogatitve zbranih 19 genov v genskih zbirkah ARCHS4 Kinases Coexpression in Reactome (2016) prikazano s stolpičnim grafikonom orodja Enrichr 25 Slika 8: Preglednica obogatitvene analize orodja Enrichr za izbranih 19 genov po zbirkah

BioPlanet in WikiPathways 26

Slika 9: Rezultati obogatitvene analize z orodjem Enrichr za izbranih 19 genov po zbirkah

ARCHS4 Kinases Coexpression in Reactome 27

(10)

1 UVOD

1.1 OPREDELITEV PROBLEMA

Multipla skleroza (MS) je kronična avtoimunska nevrodegenerativna bolezen, kjer imunski sistem prepozna mielin v ovoju aksonov znotraj centralnega živčnega sistema kot antigen.

To vodi do vnetja, ki povzroči uničenje mielina, oligodendrocit in nevronov samih.

Posledica je motnja prevajanja akcijskega potenciala po nevronu, čemur sledi razvoj motenj motoričnih funkcij, sprememb v zaznavanju, kognitivnih okvar in drugih simptomov. Značilni za MS so tudi akutni napadi, ki so simptom nove poškodbe na živčevju. Akutnim napadom sledi poslabšanje simptomov (Baecher-Allan in sod., 2018).

Vzrok za pojav bolezni ni še jasen, vendar raziskave nakazujejo, da prispevajo genetski in okoljski faktorji ter njune interakcije (Multiple Sclerosis Foundation, 2020).

Multipla skleroza je najpogostejša bolezen, ki povzroča invalidnost med mlajšimi odraslimi in je v večini primerov diagnosticirana med 20 in 50 letom starosti, s povprečjem pri 32 letih. MS lahko prizadene ljudi tudi izven tega razpona, 1,5 % obolelih je na primer mlajših od 18 let. Najnovejši podatki nakazujejo, da je trenutno 2,8 milijona bolnikov z MS, z različno pojavnostjo med etničnimi skupinami. To je porast od ocene 2,3 milijona bolnikov v letu 2013 (Walton in sod., 2020).

Poznanih je več dejavnikov tveganja za razvoj MS. Med njimi je prisotnost bolezni v ožjem družinskem krogu, infekcija z nekaterimi virusi (npr. Epstein-Barr virus in človeški herpes virus 6), kajenje, debelost, oddaljenost od ekvatorja, ženski spol, prisotnost drugih avtoimunskih bolezni (npr. Diabetes tipa 1), predniki iz Severne Evrope in drugi (Ascherio, 2013).

Multipla skleroza trenutno ni ozdravljiva, zato terapevtski pristopi temeljijo na zdravilih, ki omilijo napade in olajšajo simptome. Pogosta je uporaba steroidov, ki znižajo vnetni odziv in pospešijo okrevanje po akutnem napadu. Pogoste so tudi terapije za simptome MS, ki vključujejo fizično terapijo, antiepileptike, analgetike, antidepresive in druge. Diagnoza pogosto ni preprosta in je zanjo potrebna uporaba več različnih metod. Uporablja se nevrološki pregled, slikanje z magnetno resonanco, pregled odzivnosti živčevja, pregled krvi in ledvena punkcija. Glede na diagnozo je mogoče prepoznati obliko bolezni, saj se pojavljajo v štirih različnih oblikah glede na stopnjevanje simptomov. Te štiri oblike so:

benigna, recidivno remitentna, primarno progresivna in sekundarno progresivna oblika (NHS, 2021).

Napredek tehnologij za sekvenciranje in njihova povišana dostopnost sta omogočila globlji vpogled v genetske dejavnike povezane z razvojem MS. Predvsem so bile na tem področju v zadnjih letih pomembne asociacijske študije na ravni celotnega genoma (angl. genome- wide association study; GWAS), ki so omogočile odkritje novih genskih različic povezanih

(11)

z dozetnostjo za MS. Kljub temu je naše razumevanje genetskih dejavnikov in njihovih učinkov na biološke poti nepopolno.

1.2 NAMEN IN POVOD DELA

Odkrivanje redkih genskih različic povezanih z MS prispeva k razumevanju genetskih dejavnikov bolezni in predstavlja nov vir podatkov za nadaljnje raziskave o bioloških poteh povezanih z boleznijo. Z dodatnimi podatki o genetskih dejavnikih lahko prispevamo k boljšemu razumevanju etiologije MS.

Namen dela je bila bioinformacijska obdelava podatkov predhodno izvedene eksomske analize in izbiranje različic ter genov povezanih z MS. Trenutno je razumevanje genetskih dejavnikov in njihovih vplivov na razvoj MS pomanjkljivo. Posledično so za razumevanje etiologije MS potrebne študije, ki omogočajo razumevanje interakcij med genetskimi dejavniki in vpletenimi biološkimi potmi. Namen raziskave je izbiranje najzanesljivejših kandidatnih genov izmed tistih, v katerih so odkrite redke različice, in funkcionalna obogatitvena analiza izbranih genov in njihovih redkih različic, ki so bili predhodno odkriti s pristopom GWAS pri preiskovancih z MS.

1.3 HIPOTEZE

V okviru magistrskega dela smo zastavili dve hipotezi:

• V genih, ki so bili predhodno odkriti s pristopom GWAS, so prisotne redke genetske spremembe, ki so povezane z genetsko nagnjenostjo za MS.

• Geni z redkimi genskimi različicami, povezanimi z genetsko nagnjenostjo za MS, so prekomerno prisotni znotraj bioloških poti

(12)

2 PREGLED OBJAV

2.1 DEDNOST MULTIPLE SKLEROZE

Dedne bolezni lahko delimo na več oblik glede na način dedovanja. Monogenske bolezni, kjer je prizadet le en gen, lahko delimo na avtosomska dominantno ali recesivno dedovanje. Pri kromosomskih boleznih pride do spremembe v strukturi ali številu kromosomov. Spremembe vključujejo insercije, delecije, podvojitve, inverzije in druge.

Prav tako poznamo dedne bolezni pogojene z mitohondrijsko DNA, ki se deduje prek matere, saj le jajčne celice prispevajo mitohondrije za zigoto. Te tri oblike dednih bolezni sledijo predvidljivemu modelu Mendelskega dedovanja. MS ne sledi Mendelskemu dedovanju. Dosedanje razumevanje nakazuje na kompleksno bolezen, z več vpletenimi geni in razvojem pogojenim z okoljskimi dejavniki ter življenjskim slogom (Genetic Disorders, 2021).

Konkordanca je v genetiki definirana kot odstotek parov dvojčkov, ki imata isto lastnost, bodisi prisotno ali odsotno. Raziskovalci so v študiji na Kanadski populaciji pregledali skupino 354 parov dvojčkov. Enojajčni dvojčki so imeli konkordanco 25,4 %, medtem ko so dvojajčni dvojčki imeli konkordanco 5,4 %. Prav tako so ugotovili, da dvojčki nimajo višje verjetnosti za razvoj MS od preostale populacije (Willer in sod., 2003). Brat ali sestra bolnika z MS ima večjo verjetnost za razvoj MS od preostale populacije. V študiji, izvedeni na Švedskem so raziskovalci pregledali 28161 bolnikov z MS in ugotovili, da ima brat ali sestra bolnika približno sedemkrat večjo verjetnost za razvoj MS od preostale populacije (Westerlind in sod., 2014). Rezultati predhodnih študij so nakazovali višje tveganje v ožji družini. Te študije potrjujejo tako ne-Mendelsko dedovanje MS kot pomembnost genetskih dejavnikov za njen razvoj.

2.2 POJAVNOST BOLEZNI PO POPULACIJAH

Odstotek populacije, ki oboli za MS, ni enakomeren po celem svetu. Pojavnost MS je različna od države do države in je različna tudi med skupinami ljudi znotraj ene države, pogosto glede na etnično ozadje. Svetovna zdravstvena organizacija (angl. World Health Organization; WHO) deli svet na šest regij: Evropa, Ameriki, Vzhodni Mediteran, Jugovzhodna Azija, Afrika in Zahodni Pacifik. Evropa in Ameriki imata najvišjo pojavnost MS - na 100000 prebivalcev jih v povprečju v Evropi oboli 133 in 112 v Amerikah.

Pojavnost na 100000 prebivalcev je v Vzhodnem Mediteranu 30, v Jugovzhodni Aziji devet, v Afriki pet in v Zahodnem Pacifiku pet. Svetovna pojavnost je tako 36 obolelih na 100000 ljudi. Med državami znotraj regij je prisoten opazen razpon v pojavnosti MS.

Bolezen je najbolj prisotna v Evropi in Severni Ameriki, skupaj predstavljata večinski delež svetovne populacije z boleznijo. V Preglednici 1 so predstavljeni podatki za države Evrope po številu bolnikov na 100000 prebivalcev (Walton in sod., 2020).

(13)

Preglednica 1: Prevalenca MS v Evropskih državah prikazana s številom bolnikov z MS na 100000 prebivalcev (Multiple Sclerosis International Federation, 2019).

Država Število MS bolnikov na 100000

prebivalcev

Albanija 30

Andora Ni podatka

Avstrija 153

Belgija 104

Belorusija 50

Bosna in Hercegovina 91

Bolgarija Ni podatka

Češka Republika 187

Črna Gora 111

Danska 282

Estonija 113

Finska 218

Francija 155

Grčija 124

Hrvaška 144

Irska 193

Islandija 212

Italija 208

Latvija 107

Liechtenstein Ni podatka

Litva 104

Luksemburg Ni podatka

Madžarska 90

Malta 91

Moldavija 33

Monako Ni podatka

Nemčija 303

Nizozemska 150

Norveška Ni podatka

Poljska 120

Portugalska 56

Romunija 35

Rusija 55

San Marino 337

Severna Makedonija 82

Slovaška Ni podatka

Slovenija 152

Španija 120

Srbija 136

Švedska 218

Švica 180

Ukrajina 48

Vatikan Ni podatka

Združeno Kraljestvo 196

Etnično ozadje vpliva na posameznikovo verjetnost za razvoj bolezni. Ljudje z Evropskimi predniki, predvsem iz Severne Evrope, so skupina z največjo verjetnostjo za razvoj MS.

Nizko verjetnost za razvoj MS imajo potomci Ameriških Domorodcev, Azijcev in Afričanov (Amezcua in McCauley, 2020). Znotraj držav z visoko incidenco so etnične skupine z nizko incidenco. Primeri so na primer Inuiti v Kanadi, ki so med skupinami z

(14)

najnižjo prisotnostjo MS. To nizko prisotnost imajo tudi Maori, Laponci in Avstralski Domorodci (Warren in sod., 2001).

2.3 OKOLJSKI DEJAVNIKI ZA RAZVOJ MULTIPLE SKLEROZE

Dednost le deloma obrazloži pojav bolezni. Čeprav mehanizem razvoja bolezni ni še popolnoma poznan, podatki podpirajo vzročno povezavo z nekaterimi dejavniki tveganja.

Do sedaj je bilo prepoznanih več okoljskih dejavnikov, ki pripomorejo k razvoju bolezni.

Ti vključujejo zemljepisno širino, infekcija z Epstein-Barr virusom (EBV), pomanjkanje vitamina D in kajenje. Vpliv okoljskih dejavnikov ni zanemarljiv in trenutno razumevanje bolezni nakazuje pomembnost tako okoljskih kot genetskih dejavnikov ter interakcij med njima (Ascherio, 2013).

2.3.1 Zemljepisna širina

Nihanje v pojavnosti MS glede na zemljepisno širino je opazno, pojavnost se namreč povečuje z oddaljenostjo od ekvatorja. Pojav je bil opažen na več delih sveta, vključno z Evropo, Severno Ameriko, Japonsko, Avstralijo in Novo Zelandijo, vendar ne velja za vse države. V Italiji in severnih delih Skandinavije je pojav obraten, vendar se to da obrazložiti s prisotnostjo različnih genotipov človeških levkocitnih antigenov (angl. human leukocyte antigen; HLA). Prav tako ta pojav ni prisoten v Kanadi in Argentini. V obeh državah je sicer prebivalstvo razporejeno po relativno ozkem pasu zemljepisne širine. Količina svetlobe, vključno z ultravijoličnim (UV) spektrom, se niža z oddaljenostjo od ekvatorja.

Na Norveškem je MS bolj pogosta v mestih oddaljen od morja kot v obalnih ribiških mestih. Kot obrazložitev tega pojava je bilo predlagano, da dieta bogata z ribami, ki so prehranski vir vitamina D, kompenzira za pomanjkanje vitamina D preko izpostavljenosti UV (natančneje UVB) svetlobi (Simpson in sod., 2011).

2.3.2 Vitamin D

Vitamin D je skupno ime za skupino lipidofilnih vitaminov z mnogimi funkcijami v telesu.

Obstaja več oblik vitamina D: D1, D2, D3, D4 in D5. Po navadi s pojmom vitamin D govorimo o vitaminih D2 ali D3, ki sta najpogostejša. V jetrih se hidroksilirata v obliko 25- hidroksivitamin D3 (25(OH)D). To transportno obliko vitamina prenaša po krvnem obtoku vitamin D vezoči protein (angl. vitamin D-binding protein; VDBP). V ledvicah je spremenjen v aktivno obliko – 1,25(OH)2D prek 1α hidroksilaze, ki jo kodira gen CYP27B1. Aktivna oblika se veže na receptor za vitamin D (VDR, ki ga kodira gen VDR) na tarčni celici in vpliva na izražanje genov. Po navadi učinkuje na ionske kanale.

Pomembno za MS je, da je 1α hidroksilaza prisotna v mitohondrijih več tipov celic imunskega sistema in nevronih ter glija celicah CŽS (Bikle 2014).

(15)

Vitamin D ima več regulacijskih funkcij v imunskem sistemu, vključno s celično diferenciacijo, proliferacijo, regulacijo citokinov in njihovih receptorjev. Prav tako uravnava izražanje alela HLA-DRB*1501 – regijo, ki je močno povezana z MS, prek odzivnega elementa. Raziskave na genih, odgovornih za delovanje vitamina D, kot sta na primer VDR in CYP27B1, so pokazale, da genetske spremembe v teh genih lahko povišajo tveganje za razvoj MS (Sawcer in sod., 2011).

2.3.3 Okužba z virusom Epstein-Barr

Virus Epstein-Barr (angl. Epstein-Barr virus; EBV) spada v družino herpes virusov in je med najpogostejšimi virusi, ki okužujejo ljudi. Okužba posameznika v otroštvu pogosto poteka blago ali asimptomatsko vendar lahko okužba posameznika v odrastlosti povzroči infekcijsko mononukleozo (IM). Infekcija z EBV v poznem življenju, torej IM, oziroma visoki nivoji EBV-specifičnih protiteles, so povezani s povišanim tveganjem za MS. Če je bolnik imel prej IM, ima približno dvakrat večjo verjetnost za razvoj MS. Raziskave tudi kažejo, da infekcija z EBV v odraslosti ne povzroča takojšnje MS, serološki testi so pokazali infekcijo pet ali več let pred diagnozo. Prav tako so raziskovalci v več študijah opazili, da je povišana količina protiteles proti EBV prisotna pred nastopom bolezni in se lahko pojavi tudi nekaj let pred diagnozo. Največjega pomena so IgG protitelesa proti Epstein-Barr jedrskim antigenom (angl. Epstein-Barr nuclear antigen; EBNA). Drugi antigeni EBV ali sorodnih virusov niso bili zaznani pred nastopom bolezni, kar nakazuje na specifično povezavo med tem antigenom in razvojem MS (Thacker in sod., 2006).

EBNA-1 je eden od proteinov v EBV, ki je tarča imunskega odziva. Rezultati študij so pokazali, da je T-celični odziv na EBNA-1 pri bolnikih z MS manj specifičen od kontrolne skupine in kažejo navzkrižno reaktivnost z mielinom. Ta navzkrižna reaktivnost je bila dokazana pri bolnikih z MS, a odsotna iz kontrolne skupine preiskovancev seropozitivnih za EBV (Lünemann in sod., 2008).

Med predlaganimi vzročnimi biološkimi potmi je tudi sproščanje αB kristalina iz limfocitov ob izpostavitvi infekcijskim dejavnikom, vključno z EBV. αB kristalin je majhna beljakovina toplotnega šoka (angl. small heat shock protein; SHSP) in je kandidat za pojav avtoimunskega odziva, saj ni prisoten v vseh tkivih in je glaven mielinski antigen.

Prav tako je bilo opaženo njegovo kopičenje v oligodendrocitih znotraj lezij v zgodnji fazi MS. Oligodendrociti so celice odgovorne za mielinizacijo aksonov in tako ključnega pomena za bolezen (Milo in Kahana, 2010).

Hayes in Acheson (2008) sta predlagala hipotezo, ki povezuje vitamin D in EBV infekcijo prek interlevkina 10 (IL10). Vitamin D zvišuje raven IL10, ki je protivnetni citokin, in EBV povzroča produkcijo virusnega analoga tega citokina. Prisotnost tega analoga lahko moti normalno delovanje imunskega sistema. Druga hipoteza predlaga, da je pri ljudeh z genetsko predispozicijo za MS možen drug mehanizem. Z EBV okužene celice B naj bi v

(16)

tarčnem organu proizvajale patogena avtoimunska protitelesa in s tem omogočala avtoreaktivnim celicam T izognitev inducirani apoptozi. To podpira opažanje z EBV okuženih B celic v CŽS (Hayes in Acheson, 2008).

2.3.4 Kajenje

Kajenje je povezano z mnogimi boleznimi in zdravstvenimi težavami, vključno z MS.

Dokazi v prid povezavi med kajenjem in MS so močni in vidni v več študijah, čeprav vzročna pot ni razvidna. Interakcije z znanimi genetskimi dejavniki so bile raziskane, vendar rezultati niso vedno skladni (Jafari in sod., 2009). Raziskovalci v študiji na družinah z zgodovino MS, z zdravimi člani kot kontrolo, niso našli povišanega tveganja za MS med kadilci. Raziskovalci v drugi študiji so uporabili drugačen pristop in opazovali pojavnost na ravni populacije in v obzir vzeli dva genotipa – HLA-DRB1 in HLA-A.

Rezultati kažejo, da sta odsotnost HLA-A*02 alela in prisotnost HLA-DRB1*15 alela v kombinaciji s kajenjem močno povezana z MS (Hedström in sod., 2011).

Dim iz cigaret je izredno heterogen po kemični sestavi in kajenje poviša tveganje tudi za druge avtoimunske bolezni. Kajenje ima velik vpliv na imunski sistem - deluje vnetno, spremeni signalizacijo prek celic T, znižuje klonsko ekspanzijo imunskih celic, znižuje število naravnih celic ubijalk (angl. natural killer cell; NK) poleg mnogih drugih učinkov (O'Gorman in sod., 2012).

2.4 GENETSKI DEJAVNIKI ZA RAZVOJ MULTIPLE SKLEROZE

Zgodnji raziskave na področju genetskih dejavnikov MS so bili izvedeni na družinah z več bolniki. Rezultati teh študij lahko doprinesejo veljavne rezultate pri boleznih z Mendelskim dedovanjem, vendar edina skupna povezava, ki so jo te študije našle pri MS, je bil lokus za poglavitni kompleks tkivne skladnosti (angl. major histocompatibility complex; MHC) tipa II. Drugi genetski dejavniki niso prešli praga za statistično značilnost. Ta metoda ne prinaša globokega vpogleda v kompleksne bolezni kot je MS, zato je bil potreben drugačen pristop. GWAS so študije na ravni genoma, s katerimi analiziramo pogostost različic genov med dvema populacijama; populacija bolnikov in kontrolna populacija. S pristopom GWAS lahko poiščemo različice genov, najpogosteje različice enega nukleotida (angl.

single nucleotide variant; SNV), ki so bolj pogoste pri bolnikih kot kontrolni skupini.

Razmerje med pogostostjo pojava bolezni znotraj ene in druge skupine je razmerje obetov (angl. odds ratio; OR). Dandanes se za genotipizacijo posameznikov najpogosteje uporablja mikromreže (mikročipe). Z njimi se lahko istočasno analizira nad 500000 genetskih različic. V vsaki analizi je tudi pomembna statistična značilnost rezultatov. V ta namen je pogosta izvedba hi-kvadratnega testa, katerega rezultat mora biti p-vrednost nižja od 5 * 10-8. Z uporabo pristopa GWAS so bile prvič odkrite različice genov povezane z MS izven lokusa MHC (Patsopoulos, 2018).

(17)

2.4.1 Lokus MHC

Prvi lokus, ki je bil povezan z MS je bil lokus MHC, ki zapisuje proteine HLA. MHC delimo na tri regije. MHC I in MHC II sta povezana s predstavljanjem antigenov na površini celice medtem, ko je MHC III povezan s komplementnim sistemom. MHC II je načeloma izražen le v celicah specializiranih za predstavljanje antigenov, kot so dendritične celice, makrofagi in limfociti B. Naloga ustreznih molekul HLA iz MHC II je namreč predstavitev zunajceličnih antigenov CD4+ celicam T kot del pridobljenega imunskega sistema. Po fagocitozi tujka se znotraj lizosomov na vezavno mesto na HLA veže antigen. Ta je potem premeščena na površino celice, kjer predstavi antigen CD4+

celici T. Do sedaj so bili z MS povezani predvsem geni znotraj MHC II. MHC II je bil povezan tudi z mnogimi drugimi avtoimunskimi boleznimi (Janeway in sod., 2001).

Najmočnejšo povezavo z MS ima haplotip HLA-DR2, ki vsebuje tri alele z zapisi za beta verigo molekul HLA: HLA-DRB1*1501, HLA-DRB5*0101 in HLA-DQB1*0602 (Holmes in sod., 2005). HLA-DRB1*1501 ima največji vpliv z OR 3,08. Ljudje s haplotipom HLA-DR2 imajo nižjo povprečno starost pri kateri se bolezen razvije.

Homozigotnost za HLA-DR2 vodi do višjega tveganja za razvoj MS kot heterozigotnost in tudi do hujšega poteka bolezni. To skupaj z drugimi raziskavami je močen dokaz v prid vloge tega haplotipa pri MS. Pri ljudeh z različnimi etničnimi ozadji aleli ne predstavljajo enakega tveganja. V Japonski populaciji na primer je glavna različica za tveganje HLA- DRB1*0405, ki ni najpomembnejša pri večini Evropskih populacij. Namesto tega je zanje najpomembnejša HLA-DRB1*0405 in je HLA-DRB1*1501 drugi najpomembnejši dejavnik, če posameznik nima različice HLA-DRB1*0405. Severno Evropske in Afriško Ameriške populacije si delijo HLA-DRB1*1501 kot najpomembnejšo različico za tveganje, vendar imata različne sekundarne gene za tveganje. Za severne Evropejce so to HLA-DRB1*0301, HLA-DQB1*0201 in HLA-DRB1*1303. Za Afriške Američane sta najpomembnejši različici za tveganje HLA-DRB1*1503 in HLA-DRB1*0405.

Nekateri aleli imajo zaščiten vpliv proti MS, vendar se to tudi razlikuje med populacijami.

Iz MHC II sta to HLA-DRB1*0401 in HLA-DRB1*1101, prvi deluje zaščitno za severne Evropejce medtem ko oba delujeta za Afriške Američane. Zaščiten vpliv imajo lahko tudi aleli iz MHC I. V severnih Evropejcih sta to HLA-A*02 in HLA-B*44 s tem da le slednji deluje zaščitno za afriške Američane (Didonna in Oksenberg, 2015).

2.4.2 Interlevkini

S pristopom GWAS je bilo prvič možno odkriti gene povezane z MS izven lokusa MHC.

Med temi geni so bili tudi geni za receptorje interlevkinov. To so signalne molekule, uvrščene med citokine, od katerih je močno odvisno delovanje imunskega sistema. Njihov učinek in tarčne molekule se močno razlikujejo, poznamo namreč 17 skupin interlevkinov.

Leta 2007 so raziskovalci v študiji Mednarodnega Konzorcija Genetike Multiple Skleroze

(18)

odkrili SNV-je v genih za IL2Rα in IL7Rα povezane z dovzetnostjo za razvoj MS. To sta alfa verigi receptorjev za interlevkin 2 in interlevkin 7 (Hafler in sod., 2007).

Različice v genih za IL2Rα in IL7Rα so povzročile spremembe pri vodotopnosti proteinov, kar lahko vodi do motnje signalizacije. Polimorfizmi v obeh genih so bili povezani tudi z drugimi avtoimunskimi boleznimi, kar nakazuje na spremembo uravnavanja imunskega odziva kot krivca za MS. Pri miših je sprememba v genu za interlevkin 2 vodila do napake delovanja CD4 in CD25 regulatornih celic T. Motnja delovanja teh celic je povezana z več avtoimunskimi boleznimi (Gregory in sod., 2007; Maier in sod., 2009).

2.4.3 Biološka pot JAK/STAT

JAK-STAT je signalizacijska pot, ki jo uporabljajo citokini za uravnavanje delovanja tarčnih celic. Pomembna je za prirojeni imunski sistem, uravnavanje prirojene imunosti in za omejevanje vnetnega odziva. Sestavlja ga receptor za citokin, Janus kinaza (JAK) in proteini STAT, ki prenesejo signal in delujejo kot aktivatorji transkripcije. Pomemben del so tudi SOC molekule, ki delujejo kot inhibitorji citokinske signalizacije, saj lahko sprožijo razgradnjo JAK. Produkti poti JAK-STAT so neizogibno povezani z interlevkini, saj delujejo kot posrednik med njimi in celičnim odzivom. Ni presenetljivo torej, da so bili polimorfizmi v teh zapisih povezani z mnogimi avtoimunskimi boleznimi, vključno z MS.

Baranzini in sod. (2009) so ugotovili, da pri bolnikih z MS prihaja do prekomernega izražanja genov odvisnih od STAT signaliziranja, kot so na primer geni za IL-23R, IL21, IL22, INF-γ, CXCR3 in HLA-DR (Baranzini in sod., 2009). Specifično so rezultati študije pokazali, da je STAT3 povezan z MS. To podpira tudi dejstvo, da je količina STAT3 povišana v celicah T in monocitih bolnikov med ponovnim zagonom bolezni (Frisullo in sod., 2006).

2.4.4 Biološka pot NF-κB

Med naborom celične signalizacije je tudi proteinski kompleks NF-κB. Ta je prisoten v skoraj vseh tipih človeških celic in je odgovoren za nadzor transkripcije. Med drugimi signali se odziva tudi na citokine in uravnava imunski odziv na infekcije. Tako kot pri poti JAK-STAT so polimorfizmi povezani tudi z avtoimunskimi boleznimi. Sestavlja ga pet genov iz dveh skupin. V skupini I sta NF-κB1 in NF-κB2, tudi poznana kot p105/p50 in p100/p52; kodirata ju gena NFKB1 in NFKB2. V tem primeru sta p105 in p100 prekurzorja za NF-κB1 in NF-κB2 in delujeta kot inhibitorja signalov, podobno kot proteini iz družine IκB, ki so točno za to namenjeni. V skupini II so RelA (znan tudi kot p65), RelB in c-Rel;

kodirajo jih geni RELA, RELB in REL. Pot ima lahko nevrodegenerativne ali nevroprotektivne učinke, odvisno od signalne molekule (Sarnico in sod., 2009).

(19)

Različice enega nukleotida v genih poti NF-κB so bili povezani s prekomerno aktivacijo poti v MS. Tak polimorfizem je na mestu 738 gena IκBL, ki povzroči drugačnosmiselno spremembo in poviša tveganje za razvoj MS. Promotor gena IκBα je tudi dejavnik tveganja – insercija v njem je bila povezana s primarno progresivno fazo MS (Miterski in sod., 2002). Ker ima pot NF-κB tudi nevroprotektivno vlogo je njena pravilna regulacija pomembna za omejevanje demielinizacije. Med spremembami, ki lahko inhibirajo to nevroprotektivnost je delecija v genu za IKKβ, ki je podenota IκB kinaze. Z izgubo pravilnega delovanja inhibitornih lastnosti IKKβ prihaja do poškodbe aksona. Med drugimi proteini NF-κB, ki so jih GWAS povezale z MS so RelA, IκBα, IκBz, NIK, Bcl10 in MALT1. Na NF-κB vpliva tudi druga signalizacijska pot povezana z MS – Notch. Tako ima pot Notch lahko indirekten vpliv na razvoj MS (Liu in sod., 2017).

2.4.5 Redke genske različice

V zadnjih letih se odkriva pomembnost redkih genskih različic kot dejavnikov tveganja za razvoj bolezni, vključno z MS. Mednarodni Konzorcij za Ggnetiko multiple skleroze je izvedel analizo več študij genetike MS, ki je vključevala 32367 bolnikov z MS in 36012 kontrol iz desetih Evropskih držav, Avstralije in več zveznih držav ZDA. Meta-analiza je vključevala preko 100000 genskih različic. Opazili so močno korelacijo med redkostjo (MAF < 5 %) različic in velikostjo njihovega posameznega učinka – redkejše različice so imele večji vpliv. Med genskimi različicami, ki jih je študija obravnavala, so različice genov s funkcijami v prirojenem imunskem sistemu (Mitrovič in sod., 2018).

S pristopom GWAS so odkrili pogoste genske različice povezane z MS, vendar njihovi rezultati pogosto niso vzeli v obzir vloge redkih različic. V študiji so raziskovalci na skupini 319 preiskovancev izvedli sekvenciranje celotnega eksoma in pri bolnikih odkrili povišano breme izredno redkih različic genov povezanih z regulacijo inflamasoma. Izredno redke različice v tem primeru pomenijo genske različice z MAF nižjo od 0,01 %. Te različice so bile značilno bolj prisotne pri bolnikih kot pri kontrolni skupini. Te različice podpirajo dokaze o pomembnosti inflamasoma in njegove regulacije v povezavi z razvojem MS (Vidmar in sod., 2019).

2.5 EPIGENETSKI DEJAVNIKI ZA RAZVOJ MULTIPLE SKLEROZE

Epigenetski dejavniki vključujejo vse načine regulacije izražanja genov, ki ne vključujejo spremembe DNA. Te so lahko dedne in se med življenjem lahko spreminjajo. Vključujejo med drugimi post-translacijsko modifikacijo histonov, nekodirajoče RNA (angl. non- coding RNA; ncRNA) in kovalentne vezave funkcionalnih skupin na nukleotide (npr.

metilacija in acetilacija). Med slednjimi je najboljše raziskana metilacija nukleotidov, ki se pri sesalcih nahajajo skoraj izključno na CpG mestih znotraj CpG otokov. Ti otoki so odseki DNA z visoko pogostostjo CpG mest, kjer citozinu po zaporedju sledi gvanin.

Epigenetika igra pomembno vlogo pri uravnavanju izražanja genov in epigenetske

(20)

spremembe so povezane z več nevrodegenerativnimi boleznimi vključno z Alzheimerjevo, Parkinsonovo in Huntingtonovo boleznijo.

2.5.1 Metilacija DNA

Pri tem epigenetskem mehanizmu DNA metiltransferaze dodajo metilno skupino na nukleotid, kar se lahko izvede le na citozinu ali adeninu. To ima v večini primerov funkcijo utišanja genov. Janson in sod. (2010) so pokazali, da v celicah T bolnikov prihaja do hipometilacije promotorske regije na IL17A, kar nagne diferenciacjo celic T proti TH17.

Te celice so nadpovprečno prisotne pri bolnikih, še posebej med ponovnimi zagoni bolezni. V drugi študiji je bila prav tako opažena nenavadna metilacija 56 promotorskih regij v DNA izolirani iz plazme. Ta vzorec metilacije se je razlikoval od kontrolne skupine brez MS in je lahko tudi razlikoval pri bolnikih izven ali med remisijo MS z visoko občutljivostjo in specifičnostjo (70,8 % in 71,2 %) (Liggett in sod., 2010). Prav tako so raziskovalci v drugi študiji opazili razliko pri metilaciji v CD4+ celicah T med bolniki in kontrolno skupino. Metilacija je bila pri bolnikih z MS značilno spremenjena v regiji MHC, največja razlika je bila pri genu HLA-DRB1. Pri bolnikih je bila opažena tako močno povišana raven metilacije kot močno znižana raven metilacije. Povišano raven metilacije DNA so opazili tudi pri genih HLA-A in HLA-C. V študiji so prav tako opazili 59 % znižano raven metilacije na 74 CpG mestih v primerjavi s kontrolno skupino.

Devetnajst od teh 74 mest je bilo v regiji MHC in 30 od preostalih 55 jih je bilo v genih, ki so bili predhodno povezani z MS (Graves in sod., 2014).

Huynh in sod. (2014) so opazili razliko v metilaciji DNA v možganih bolnikov in kontrolne skupine. Opazovali so možgansko tkivo izven lezij in v njem opazili več epigenetskih razlik. Med njimi je prisotna povišana metilacija in posledično nižje izražanje genov BCL2L2, HAGHL in NDRG1, ki so povezani z regulacijo delovanja oligodendrocit.

Prisotna je tudi hipometilacija genov za proteolizo in imunski odziv, kot sta CTSZ in LGMN.

2.5.2 Post-translacijske modifikacije histonov

Modifikacije histonov urejajo dostopnost DNA za transkripcijo. Dodajanje različnih funkcionalnih skupin spremeni naboj na histonskih proteinih in dovoli premik nukleosoma in dostop transkripcijskega mehanizma. Pogoste modifikacije so metilacija, acetilacija, fosforilacija, ubikvitinacija in druge. Pravilno delovanje oligodendrocit za tvorbo mielina je odvisno od acetilacije histonskih repov. Deacetilirano stanje teh repov je nujno za tvorbo mielina, saj se ob acetiliranem stanju izraža represor. Pri bolnikih s kronično MS so zaznali visoke nivoje acetilacije na histonih znotraj oligodendrocit. Za razliko od tega so v oligodendrocitih bolnikov v zgodnjih fazah MS opazili nizko raven acetilacije (Pedre in sod., 2011). Mastronardi in sod. (2006) so opazili tudi povišan nivo citrulinacije histonov H3 v možganih bolnikov (Mastronardi in sod., 2006). Funkcije in posledice tega niso še

(21)

znane, vendar je očitno, da pri MS prihaja do več različnih sprememb modifikacije histonov.

2.5.3 Nekodirajoče RNA

V povezavi z MS so pogosto preučevane mikro RNA (miRNA) molekule, ki so vpletene v post-transkripcijsko regulacijo genetskega izražanja. Z vezanjem na komplementarno zaporedje v mRNA preprečijo izražanje gena prek več možnih mehanizmov. V aktivnih lezijah je prišlo do povišanega izražanja miR-34a, miR-155 in miR-326, ki so vpletene v regulacijo izražanja CD47 (Junker in sod., 2009). Ta deluje kot inhibitor makrofagov.

Posledica tega je pomanjkanje inhibicije makrofagov in povišan nivo fagocitoze mielina v CNS. Noorbakhsh in sod. (2011) so prav tako opazili miR-155, miR338 in miR491 pri bolnikih s progresivno MS v primerjavi z zdravo kontrolno skupino (Noorbakhsh in sod., 2011).

Več raziskav je iskalo povezavo med MS in miRNA, vendar so te bile pogosto izvedene na prenizkem številu udeležencev za zanesljive rezultate. Kljub temu je vredno omeniti, da so tudi študije z manj udeleženci opazile spremembo izražanja miR-155 med bolniki in kontrolno skupino.

2.6 BIOINFORMACIJSKA ORODJA

Bioinformatika je znanstveno področje, ki se ukvarja z uporabo računalništva za raziskovanje bioloških sistemov. V ta namen se uporabljajo bioinformacijska orodja – računalniški programi, ki opravljajo več različnih nalog in omogočajo: poravnavo nukleotidnih zaporedij, vizualni pregled podatkov, rudarjenje podatkov, predvidevanje učinka genskih sprememb, iskanje homologije in mnoge druge funkcije. Ta orodja so v preteklih 20-ih letih postala skoraj vseprisotna, saj raziskovalcem omogočajo pridobivanje ključnih podatkov iz podatkovnih zbirk.

2.6.1 CADD

CADD (angl. combined annotation dependent depletion) je bioinformacijsko orodje za ocenjevanje patogenosti SNV-jev, insercij in delecij v človeških genih. CADD združuje več parametrov, ki jih uporabljajo druga orodja za ocenjevanje patogenosti (npr.

evolucijska ohranjenost nukleotida), v enotno oceno (angl. C-score; C-ocena). Deluje na osnovi strojnega učenja treniranega na več milijonih genskih različic in simuliranih spremembah in silico. C-ocena je logaritmična (PHRED-like) in nanjo vpliva tudi njena ocena patogenosti v primerjavi z drugimi možnimi spremembami na nukleotidu. Če je C- ocena 10 je genska različica med 1 % potencialno najbolj patogenih. Če je C-ocena 20 je različica med 0,1 % potencialno najbolj patogenih. Meja patogenosti genske različice se

(22)

razlikuje med raziskavami, vendar najpogostejša uporabljena meja za patogenost različice je C-ocena vrednosti 20 (Rentzsch in sod., 2021).

2.6.2 STRING

Podatkovna zbirka STRING omogoča pregled znanih in predvidenih interakcij med proteini z vizualizacijo mrež interakcij. Zbirka vsebuje podatke o direktnih in indirektnih povezavah med proteini. Povezave med proteini ustvari na osnovi napovednih orodji ali iz drugih podatkovnih zbirk. Povezave so označene glede na vir podatkov – ti vključujejo:

eksperimentalno potrjene povezave, povezave iz drugih podatkovnih zbirk, bližina genov v genomu, genske fuzije in sopojavnost genov. Orodje STRING poleg teh lahko prikazuje tudi predvidene povezave med geni glede na rudarjenje podatkov iz člankov, skupno ekspresijo ali homologijo z znanimi živalskimi proteini (Szklarczyk in sod., 2015).

STRING poleg vizualizacije mrež proteinskih interakcij omogoča tudi poizvedbo po funkcionalnih obogatitvah med proteini, ki jih vnesemo v orodje. S to poizvedbo lahko preverimo, če so proteini v poizvedbi prekomerno izraženi v naboru proteinov povezanih z biološko potjo, funkcijo ali fenotipom.

2.6.3 Enrichr

Enrichr je orodje za obogatitveno analizo genov pri sesalcih. Orodje primerja gene v poizvedbi z geni v genskih zbirkah in išče prekrivanja med seti genov. Genskih zbirk je več in obsegajo različne vire vključno z objavljenimi študijami in drugimi spletnimi podatkovnimi zbirkami. Enrichr vsebuje tudi genske zbirke, ki so bile ustvarjene izključno zanj. Trenutno orodje vsebuje 171 zbirk in 339127 obogatitvenih pojmov. Zbirke so označene z obogatitvenimi pojmi, ki lahko vključujejo bolezen, biološko potjo ali funkcijo, s katero so geni v zbirki povezani. Rezultati poizvedbe uvrstijo te pojme od najbolj do najmanj ustreznega za nabor genov, ki je vnesen v orodje (Chen in sod., 2013).

Orodje lahko rezultate poizvedbe predstavi na več različnih načinov. Preglednica je osnoven način in v njej so vidne posamezne ocene ustreznosti pojmov za v orodje vnesen nabor genov. Enrichr omogoča tudi vizualno predstavitev rezultatov s stolpičnim grafom.

Poleg stolpičnega grafa se lahko podatke nekaterih zbirk vizualno predstavi z mrežo in omrežjem.

(23)

3 MATERIAL IN METODE

Raziskava je sestavljena iz dveh delov. Del raziskave, ki obsega pridobitev preiskovancev in eksomsko sekvenciranje vzorcev je bil predhodno opravljen na Kliničnem Inštitutu za Genomsko Medicino (KIGM). V študijo je bilo vključenih 319 preiskovancev razdeljenih na tri skupine. Skupina z družinsko obliko MS je vsebovala 86 preiskovancev. Ti preiskovanci so izhajali iz družin z več člani z boleznijo z le enim članom na družino vključenim v študijo. Skupina s sporadično obliko MS je vsebovala 89 preiskovancev.

Kontrolna skupina je vsebovala 144 preiskovancev iz istih etničnih skupin kot preostali skupini. Bolezen je bila pri bolnikih diagnosticirana po McDonald diagnostičnih merilih.

Etnična ozadja preiskovancev vključujejo slovenske, hrvaške in srbske prednike.

Povprečna starost preiskovancev je bila 43 let. Razmerje med ženskami in moškimi preiskovanci je bilo 1,6 proti 1. Starost in razmerje med spoloma se ni značilno razlikovalo med tremi skupinami preiskovancev.

Sekvenciranje celotnega eksoma (angl. whole exome sequencing; WES) je bilo izvedeno z vzorci krvi preiskovancev z uporabo Illumina HiSeq-2000 s povprečnim 30-kratnim prekrivanjem. Odčitki zaporedja so bili poravnani z referenčnim genomom hg19 z orodjem Burrowers-Wheeler Aligner (BWA) v skladu z najboljšimi praksami in navodili genomskih analiznih orodji (angl. genome analysis toolkit; GATK). Za pripravo knjižnice so bili uporabljeni kompleti reagentov Agilent-All-Exon 2, 5 in 6 ter Illumina Nextera- Exome. Z namenom znižanja napak, ki izvirajo iz kompletov reagentov, so bili v študijo vključeni in analizirani le lokusi, ki so bili zaznani z vsemi kompleti reagentov. V študijo so bile vključene le genske različice, ki so bile uspešno genotipizirane pri več kot 95 % preiskovancev. Različice z MAF nad 0,05 v podatkovni zbirki Genome Aggregation Database (gnomAD) ali v pridobljenem naboru podatkov so bile izključene iz analize. Prav tako so bile izključene genske različice, ki so vsebovale sinonimne genske spremembe. Z namenom znižanja možnosti lažno pozitivnih branj sprememb na nukleotidih je bila datoteka s poravnavo ročno pregledana z uporabo programa Integrative Genomics Viewer (IGV) (software.broadinstitute.org) (Robinson in sod., 2017). Genske različice so bile obdelane z orodji snpEff in ANNOVAR iz programskega paketa Variant Tools.

Podatkovna zbirka gnomAD je bila uporabljena kot vir podatkov o frekvencah genskih različic. Patogenost genskih sprememb je bila ocenjena z uporabo orodja CADD. Grafični pregled predhodno opravljenega dela na KIGM in dela, opravljenega v okviru te študije je prikazan na Sliki 1.

Sledila je selekcija genskih različic, ki so ustrezale trem pogojem. Frekvenca manj pogostega alela je morala biti nižja od 0,05, kar je značilno za redke različice. Vrednost napovedi orodja CADD je morala biti 20 ali več. Genska različica je morala biti prisotna v vsaj eni od skupin preiskovancev z MS in odsotna iz kontrolne skupine.

(24)

Po selekciji različic smo pridobljene gene analizirali z orodjem STRING, v katerega smo vnesli seznam genov.To spletno orodje omogoči iskanje poznanih ali predvidevanih interakcij oziroma funkcionalnih povezav med proteini s pomočjo rudarjenja podatkov.

Orodje za vsako poizvedbo poda p-vrednost, s katero lahko ocenimo statistično značilnost povezav glede na število genov v poizvedbi.

Izbrani geni so bili razdeljeni glede na prisotnost pri bolnikih z družinsko ali sporadično obliko MS. Razlog za to je pogosta razlika v poteku bolezni glede na njen izvor. Poizvedba po mreži proteinskih interakcij z orodjem STRING je bila izvedena posamezno za skupino z družinsko obliko MS in skupino s sporadično obliko MS. Poizvedba je bila nato izvedena tudi na skupnem naboru genov prisotnih v obeh skupinah. Skupen nabor genov je bil z orodjem STRING pregledan za funkcionalne obogatitve. S tem orodjem lahko poleg določanja proteinskih interakcij za določen seznam genov ugotovimo tudi značilno povezane biološke poti.

Skupni nabor izbranih genov je bil nato pregledan s spletnim orodjem za obogatitveno analizo Enrichr. Orodje primerja vanj vnesen nabor genov s predhodno obdelanimi nabori genov iz podatkovne zbirke različnih genskih zbirk in išče med njima prekrivanja. Vsak poznan gen ima sebi pripisane pojme glede na raziskave povezane z njim. Orodje nato razvrsti pojme povezane z geni v posamezni zbirki glede na prekrivanje z geni v poizvedbi.

(25)

4 REZULTATI

Devetnajst genov, povezanih z MS, je vsebovalo 25 redkih genskih različic, ki so bile odsotne pri preiskovancih v kontrolni skupini in prisotne le pri bolnikih z MS. Imena genov in genskih različic so prikazana na Sliki 2. Gen SORBS2 je vseboval tri genske različice medtem ko so geni AGAP2, CLEC16A, ELMO1 in RREB1 vsebovali dve genski različici. Redke različice treh genov so bile prisotne tako pri bolnikih s sporadično kot pri bolnikih z družinsko obliko MS: ELMO1, CLEC16A in SORBS2. Od teh genov je le gen ELMO1 imel eno gensko različico prisotno v obeh skupinah, CLEC16A in SORBS2 sta bila prisotna z dvema različnima različicama med skupinama. S spletnim orodjem STRING smo med izbranimi 19 geni odkrili funkcionalne obogatitve, povezane z imunskim sistemom in MS, vendar ni bilo značilnih medsebojnih interakcij med geni (Slike 3-5). Z orodjem Enrichr smo odkrili obogatitev izbranih genov v bioloških poteh povezanih z imunskim sistemom, celično signalizacijo, celično diferenciacijo, uravnavanjem citoskeleta in biološko potjo Wnt, ki je povezana z MS.

Slika 1: Grafični pregled korakov raziskave predhodno opravljenih predhodno na KIGM in korakov opravljenih v okviru te študije. S sivo barvo so označeni postopki medtem ko so s temno modro barvo označena orodja, ki so jih postopki uporabljali. Na KIGM so bili opravljeni prvi trije koraki: odvzem vzorcev krvi za preiskavo, sekvenciranje celotnega eksoma in dopolnjevanje podatkov iz podatkovne zbirke gnomAD ter orodja CADD. V okviru tega dela je bil izveden izbor genskih različic opisan v poglavju Materiali in metode, analiza funkcionalnih obogatitev z orodji STRING in Enrichr in pregledovanje genskih različic ter bioloških poti, ki so bile opisane v povezavi z MS.

4.1 ANALIZA REZULTATOV EKSOMSKEGA SEKVENCIRANJA

Selekcijski pogoji so bili: redkost različice (MAF < 0,05), ocena orodja CADD ≥ 20 in prisotnost v vsaj eni skupini bolnikov z istočasno odsotnostjo iz kontrolne skupine.

Selekcijskim pogojem je ustrezalo 25 genskih različic pripadajočih 19 genom. Teh 25 različic predstavlja 2,66 % vseh različic v raziskavi. Imena genov, število pripadajočih

(26)

različic in biološke funkcije genov, so predstavljene v preglednicah 2 in 3. V genu SORBS2 so bile prisotne tri genske različice – ena pri bolnikih z družinsko obliko in dve pri bolnikih s sporadično obliko MS. Ena različica gena ELMO1 je bila prisotna v obeh skupinah, razdeljenih po obliki MS. V skupini s sporadično obliko MS je tudi različica gena ELMO1, ki ni prisotna v skupini z družinsko obliko MS. Gen CLEC16A je vseboval dve različici – ena je bila prisotna pri bolnikih z družinsko obliko medtem ko je bila druga prisotna pri bolnikih s sporadično obliko MS. V genu AGAP2 smo odkrili dve genski različici s tem, da sta bili obe prisotni le pri bolnikih s sporadično obliko MS. Dve različici gena RREB1 sta bili prisotni pri bolnikih z družinsko obliko MS. Za razliko od različice gena ELMO1 nobena različica genov AGAP2, CLEC16A, RREB1 in SORBS2 ni bila zaznana istočasno v skupini z družinsko in skupini s sporadično obliko MS. Devetnajst genskih različic, ki ustrezajo kriterijem izbire, je prikazanih glede na prisotnost pri bolnikih z družinsko ali sporadično obliko bolezni v Preglednici 2 in Preglednici 3. Z orodjem STRING zaznane obogatitve genov, ki ustrezajo kriterijem izbora, v bioloških poteh so prikazane v Preglednici 4.

Med podatki je bilo vseh 938 genskih različic redkih, torej z MAF pod 5 %. Dvesto petnajst različic je bilo brez ocene MAF iz podatkovne zbirke GnomAD, torej 22,92 % vseh različic iz našega nabora podatkov. Odsotnost iz te zbirke nakazuje izredno redkost različice, zato so bile te genske različice obravnavane kot MAF pod 5 %. Tristo dvainpetdeset različic je imelo C-oceno 20 ali več, torej 37,52 % vseh različic. Osemdeset različic je bilo prisotnih pri preiskovancih z MS in odsotnih iz kontrolne skupine, torej 8,53

% vseh različic. Pogoj za izbiro je bila prisotnost različic pri preiskovancih z družinsko obliko MS ali pri preiskovancih s sporadično obliko MS in odsotnost med preiskovanci iz kontrolne skupine. Preglednica iz programa Microsoft Excel s končnim naborom 25 genskih različic je prikazana na Sliki 2.

(27)

Slika 2: Preglednica rezultatov analize z naborom vseh genov, ki so ustrezali kriterijem izbora, povezanih z MS in njihovih genskih različic v programu Microsoft Excel. Prvi trije stolpci so o družinski MS in povedo koliko preiskovancev z družinsko MS je bilo heterozigotov oziroma homozigotov za dani alel in kakšno je bilo skupno število. Naslednjih šest stolpcev nam poda te podatke o preiskovancih s sporadično MS in preiskovance iz kontrolne skupine. Številke v teh stolpcih nam povedo pri kolikšnem številu preiskovancev je bila različica zaznana. Z rdečo barvo so označene celice, ki vsebujejo preiskovance z alelom, medtem ko zelene celice pomenijo odsotnost alela pri preiskovancih iz tistega stolpca. Stolpci na desni vsebujejo ime gena, frekvenco alela, C-oceno in ime nukleotidne zamenjave. Nekaterih frekvenc alela podatkovna zbirka GnomAD ne vsebuje. Te vrstico niso bile izključene, saj njihova odsotnost iz podatkovne zbirke GnomAD nakazuje izredno redkost.

(28)

Preglednica 2: Biološke funkcije, število različic in imena genov, ki so ustrezali kriterijem izbire, pri bolnikih z družinsko obliko MS. Drugi stolpec vsebuje število različic, ki jih vsebuje vsak gen. Tretji stolpec vsebuje poglavitne biološke funkcije gena oziroma njegove predvidene povezave z biološkimi funkcijami.

Geni družinske

oblike MS Število različic Biološke funkcije in interakcije gena

C1orf106 1 Imunski sistem

CLEC16A 1 Imunski sistem

ELMO1 1 Citoskelet, celična mobilnost, fagocitoza MALT1 1 Signalizacija, imunski sistem, diferenciacija

MMEL1 1 Neznano, verjetno homeostaza

NCF4 1 Imunski sistem

PTPRK 1 Imunski sistem, diferenciacija, rast, signalizacija RREB1 2 Signalizacija, proliferacija

SORBS2 2 Citoskelet

TCF7 1 Diferenciacija, signalizacija

TNKS 1 Signalizacija

ZBTB46 1 Imunski sistem

Preglednica 3: Biološke funkcije, število različic in imena genov, ki so ustrezali kriterijem izbire, pri bolnikih s sporadično obliko MS. Drugi stolpec vsebuje število različic najdenih za vsak gen. Tretji stolpec vsebuje poglavitne biološke funkcije gena oziroma njegove predvidene povezave z biološkimi funkcijami.

Geni sporadične

oblike MS Število različic Biološke funkcije in interakcije gena

AGAP2 2 Apoptoza

AHI1 1 Diferenciacija

ARHGEF3 1 Signalizacija, citoskelet

CLEC16A 1 Imunski sistem

DDAH1 1 Imunski sistem, apoptoza

ELMO1 2 Citoskelet, celična mobilnost, fagocitoza EOMES 1 Diferenciacija, proliferacija

KCNMA1 1 Živčni sistem

MYNN 1 Živčni sistem

SORBS2 1 Citoskelet

(29)

4.2 ANALIZA INTERAKCIJ GENOV IN OBOGATITVENA ANALIZA

S spletnim orodjem STRING je bila najprej izvedena analiza interakcij genov. Genske različice so bile razdeljene glede na skupino bolnikov, v kateri so bile zaznane. Geni, ki vsebujejo te različice, so bili potem analizirani z orodjem STRING za medsebojne interakcije. Interakcijsko analizo smo najprej izvedli za gene različic, zaznanih pri bolnikih z družinsko obliko MS. Nato je bila izvedena analiza interakcij genov tudi za gene različic, zaznanih pri bolnikih s sporadično obliko MS. Sledil je tudi pregled vseh pridobljenih genov skupaj. Z orodjem sno pridobili mrežo interakcij med proteini za vnesene podatke - rezultati so prikazani na Slikah 3-5. Med proteini, ki jih kodirajo ti geni nismo odkrili značilnih medsebojnih interakcij. Vsak krog predstavlja protein, obarvani so zgolj za lažje razlikovanje. Interakcije med geni so prikazane s povezavami med krogi, vrste interakcij so opisane v legendi. S tem orodjem smo izvedli tudi analizo funkcionalnih obogatitev med zbranimi 19 geni, kar prikazuje Preglednica 4.

Obogatitvena analiza je bila izvedena tudi z orodjem Enrichr, ki je odkrilo več obogatitev med štirimi genskimi zbirkami: ARCHS4 Kinases Coexpression, BioPlanet (2019), Reactome (2016) in WikiPathways Human (2019). Rezultati obogatitvene analize so prikazani na Slikah 6-9.

Slika 3: Mreža proteinskih interakcij STRING za izbrane gene pri bolnikih z družinsko obliko MS.

Prepoznana interakcija je le med CLEC16A in MMEL1 prek rudarjenja besedil. Slika je ekranski posnetek rezultatov prikazanih z orodjem STRING.1

1 Slike 3-9 so ekranski posnetki rezultatov analize s spletnima orodjema STRING in Enrichr. Rezultati so zaradi lažjega razumevanja ohranjeni v izvornem jeziku.

(30)

Slika 4: Mreža proteinskih interakcij STRING za izbrane gene pri bolnikih s sporadično obliko MS. V mreži ni prepoznanih interakcij med v orodje vnesenimi geni. P-vrednost je 1. Slika je ekranski posnetek rezultatov prikazanih z orodjem STRING.

(31)

Slika 5: Mreža proteinskih interakcij STRING za izbrane gene pri bolnikih s sporadično in družinsko obliko MS. Od slik 1 in 2 se razlikuje po zaznani interakciji med EOMES in TCF7, povezanih na podlagi rudarjenja besedil, predvidenih genskih fuzij in sopojavnosti genov (angl. gene co-occurrence). P-vrednost je 0,184.

Slika je ekranski posnetek rezultatov prikazanih z orodjem STRING.

(32)

Preglednica 4: Funkcionalne obogatitve odkrite z orodjem STRING za 19 genov, ki so ustrezali kriterijem izbora. Stolpci vsebujejo identifikacijsko številko članka v spletni zbirki PubMed, leto izdaje dela in naslov dela. Stolpec »število prisotnih genov iz funkcionalne mreže« nam pove koliko genov iz naše poizvedbe je prisotnih v funkcionalni mreži obravnavani v delu. Stolpec »moč korelacije« (angl. strength of correlation) vsebuje logaritmično razmerje med številom proteinov v poizvedbi, povezanih s potjo in številom proteinov povezanih s potjo v naključni poizvedbi z enakim številom genov. Stolpec »stopnja napačnega odkritja«

(angl. false discovery rate) vsebuje p-vrednosti za lažno pozitivne rezultate, kjer nižja številka pomeni nižjo verjetnost, da je rezultat naključen.

Leto objave

Naslov dela Število

prisotnih genov iz funkcionalne mreže

Moč korelacije (angl.

strength of correlation)

Stopnja napačnega odkritja (angl. false discovery rate)

Identifikacijska številka članka v spletni zbirki PubMed in avtorji 2009 The Type I Diabetes

Genetics Consortium 'Rapid Response' family-based candidate gene study: strategy, genes selection, and main outcome.

4 od 37 2,05 0,001 PMID:19956109

(Julier in sod., 2009)

2015 Capture Hi-C reveals novel candidate genes and complex long- range interactions with related autoimmune risk loci.

3 od 19 2,21 0,0047 PMID:26616563

(Martin in sod., 2015)

2017 Genome-wide association study of classical Hodgkin lymphoma identifies key regulators of disease susceptibility.

3 od 23 2,13 0,0064 PMID:29196614

(Sud in sod., 2017)

2018 Variants of

Mitochondrial Genome and Risk of Multiple Sclerosis Development in Russians.

3 od 40 1,89 0,0249 PMID:30713765

(Kozin in sod., 2018)

2019 Sostdc1 Regulates NK Cell Maturation and Cytotoxicity.

3 od 10 2,49 0,018 PMID:30814306

(Millan in sod., 2019)

2020 Environmental Influencers, MicroRNA, and Multiple Sclerosis.

4 od 61 1,83 0,0022 PMID:32009827

(Mohammed, 2020)

(33)

Slika 6: Obogatitve zbranih 19 genov v genskih zbirkah BioPlanet (2019) in WikiPathways Human (2019) prikazano s stolpičnim grafikonom orodja Enrichr. Višje uvrščeni stolpci imajo višjo uvrstitev skupne ocene.

Skupna ocena je zmnožek logaritma p-ocene po Fisherjevem eksaktnem testu in z-ocene odstopanja od pričakovane uvrstitve. Slika je ekranski posnetek rezultatov prikazanih z orodjem Enrichr.

(34)

Slika 7: Obogatitve zbranih 19 genov v genskih zbirkah ARCHS4 Kinases Coexpression in Reactome (2016) prikazano s stolpičnim grafikonom orodja Enrichr. Višje uvrščeni stolpci imajo višjo uvrstitev skupne ocene.

Skupna ocena je zmnožek logaritma p-ocene po Fisherjevem eksaktnem testu in z-ocene odstopanja od pričakovane uvrstitve. Slika je ekranski posnetek rezultatov prikazanih z orodjem Enrichr.

(35)

Slika 8: Preglednica obogatitvene analize orodja Enrichr za izbranih 19 genov po zbirkah BioPlanet in WikiPathways. Vsebuje primerjavo genov iz poizvedbe po genskima zbirkama BioPlanet (2019) in WikiPathways Human (2019). Stolpec »index« je številčna uvrstitev biološke poti glede na združeno oceno iz skrajno desnega stolpca. Sledi ime biološke poti v kateri je bila zaznana obogatitev. Stolpec »P-value«

vsebuje P-vrednost Fisherjevega eksaktnega testa. Stolpec »Adjusted p-value« vsebuje P-vrednost popravljeno z Benjamini-Hochberg proceduro. Stolpec »Odds ratio« vsebuje razmerje obetov. Razmerje obetov pomeni razmerje med obeti za razvoj bolezen med ljudmi z določeno lastnostjo in ljudmi brez te lastnosti. Zadnji stolpec je »combined score« za skupno oceno, ki je izračunana kot zmnožek logaritma P- vrednosti in Z-vrednosti odstopanja od pričakovanega mesta v uvrstitvi za naključen nabor podatkov. Slika je ekranski posnetek rezultatov prikazanih z orodjem Enrichr.

(36)

Slika 9: Rezultati obogatitvene analize z orodjem Enrichr za izbranih 19 genov po zbirkah ARCHS4 Kinases Coexpression in Reactome. Stolpec »index« je številčna uvrstitev biološke poti glede na združeno oceno iz skrajno desnega stolpca. Sledi ime biološke poti v kateri je bila zaznana obogatitev. Stolpec »P-value«

vsebuje P-vrednost Fisherjevega eksaktnega testa. Stolpec »Adjusted p-value« vsebuje z metodo Benjamini- Hochberg popravljeno P-vrednost. Stolpec »Odds ratio« vsebuje razmerje obetov. Razmerje obetov pomeni razmerje med obeti za razvoj bolezen med ljudmi z določeno lastnostjo in ljudmi brez te lastnosti. Zadnji stolpec je »combined score« za skupno oceno, ki je izračunana kot zmnožek logaritma P-vrednosti in Z- vrednosti odstopanja od pričakovanega mesta v uvrstitvi za naključen nabor podatkov. Slika je ekranski posnetek rezultatov prikazanih z orodjem Enrichr.

Reference

POVEZANI DOKUMENTI

S presečno raziskavo pri slovenskih pacientih z MS, ki so bili v povprečji stari 41 let in so imeli EDSS 2,6, smo ugotovili, da ima 37 % pacientov spolno disfunkcijo ter da

In the study by Reese and colleagues (2013), it is reported that patients with progressive forms of MS have a reduced quality of life (EQ-VAS), a higher level of disability

Kakovost življenja smo merili s pomočjo osmih področij, ki so jih opredelili Schalock, Bonham in Verdugo (2008). Zanimalo nas je tudi, ali obstajajo varovalni dejavniki, ki

Glede na pogostost patoloških sprememb na črevesu izrazito simptomatskih živali in uspešno razmnoževanje rabdoklamidij (prisotnost vseh treh oblik) v črevesnih

Filogenetsko drevo naše knjižnice 16S rRNA bakterijskih genov (Slika 5), narejeno po metodi varčnosti (ang. maximum parsimony) v programu ARB, razdeli sekvence v

17 Slika 3: Porazdelitev števila dreves (N/ha) po posameznih debelinskih stopnjah v gostejšem macesnovem sestoju za leti 1982 in 2010.... 18 Slika 4: Porazdelitev temeljnice (m

Slika 2: Povprečna masa glav solate gojene v akvaponiki in v zemeljskem substratu 17 Slika 3: Povprečna masa rozet endivije gojene v akvaponiki in v zemeljskem substratu 18 Slika

Preglednica 1: Število pregledanih naprav (škropilnic in pršilnikov) glede na kraj in leto 18 Preglednica 2: Število vseh pregledanih škropilnic glede na kraj in leto 19 Preglednica