• Rezultati Niso Bili Najdeni

DIPLOMSKO DELO

N/A
N/A
Protected

Academic year: 2022

Share "DIPLOMSKO DELO"

Copied!
57
0
0

Celotno besedilo

(1)

DIPLOMSKO DELO

Polona Skrt

2021

(2)

UNIVERZITETNI ŠTUDIJSKI PROGRAM 1. STOPNJE BIOKEMIJA

Modeliranje binarnih kompleksov SARS-CoV-2 proteina ORF8 s tarčnimi proteini človeka

DIPLOMSKO DELO

Polona Skrt

MENTOR: prof. dr. Uroš Petrovič

Ljubljana, 2021

(3)

diplomskega dela

Spodaj podpisana Polona Skrt sem avtorica diplomskega dela z naslovom Modeliranje binarnih kompleksov SARS-CoV-2 proteina ORF8 s tarčnimi proteini človeka.

S svojim podpisom zagotavljam, da:

• je diplomsko delo rezultat mojega raziskovalnega dela pod mentorstvom prof.

dr. Uroša Petroviča;

• sem poskrbela, da so dela in mnenja drugih avtorjev, ki jih uporabljam v predloženem diplomskem delu, navedena oziroma citirana v skladu z navodili;

• se zavedam, da je plagiatorstvo, v katerem so tuje misli oziroma ideje

predstavljene kot moje lastne, kaznivo po zakonu (Zakon o avtorski in sorodnih pravicah – uradno prečiščeno besedilo (ZASP-UPB3) (Ur. list RS, št. 16/2007);

• sem poskrbela za slovnično in oblikovno korektnost diplomskega dela;

• je elektronska oblika diplomskega dela identična tiskani obliki diplomskega dela.

V Ljubljani, Podpis

avtorice:

(4)

dela ter za dopuščeno svobodo pri samem delu in usmeritve, ko sem jih potrebovala.

Prav tako se mu zahvaljujem za izjemno odzivnost in hiter pregled naloge.

Zahvala gre tudi doc. dr. Gregorju Gunčarju za njegov prispevek k diplomski nalogi.

V prvi vrsti pa se zahvaljujem mami za brezpogojno podporo skozi vsa leta šolanja, bratu za neštete zabavne trenutke, nonotu in noni za zaupanje ter najboljšima

prijateljicama in fantu za spodbudo in vse stisnjene pesti.

Hvala!

(5)

Virus SARS-CoV-2 je bil pri človeku prvič potrjen decembra 2019 in se za tem hitro razširil po svetu. Od preostalih koronavirusov se najbolj razlikuje v pomožnem proteinu ORF8, ki ima hkrati tudi enega od najbolj variabilnih zapisov v genomu virusa. S širjenjem virusa se pojavljajo vedno nove različice virusa in proteina ORF8, ki jih najdemo po svetu ter tudi na območju Slovenije. Te se pogosto kažejo v spremenjenem poteku okužbe ali razvoja bolezni COVID-19, kar nam daje iztočnico za raziskave molekularnega mehanizma delovanja virusnih proteinov. Kot interaktorji proteina ORF8 so bili napovedani številni proteini človeka, med drugimi tudi ADAM9, PLOD2, ITGB1, TGFB1 in IL17RA, ki vsi sodelujejo v fizioloških procesih, povezanih s simptomi okužbe z virusom SARS-CoV-2. V raziskavi smo se osredotočili na spremembe S24L, Y73C in L84S proteina ORF8, ki so bile najpogostejše v začetnih različicah virusa. Analiza interakcij je potekala najprej eksperimentalno, z metodo dvohibridnega sistema kvasovke, nato pa smo iste interakcije analizirali še z aktualnimi računskimi metodami molekulskega sidranja, kar je bil namen te diplomske naloge. Za uspešno bioinformatsko analizo smo pripravili modele struktur tarčnih proteinov, ki so bili napovedani z algoritmoma I-TASSER in AlphaFold ali eksperimentalno določeni, molekulsko sidranje ORF8 s proteini človeka pa je bilo izvedeno na spletnih strežnikih HADDOCK in ClusPro. V eksperimentalnem delu analize je uvedba mutacij v nekaterih primerih privedla do odstopanja rezultata od referenčnega, kar je služilo postavitvi hipoteze, da aminokisline, ki so spremenjene zaradi uvedenih mutacij in s tem vplivajo na eksperimentalen rezultat, sodelujejo v interakcijski površini proteinskega kompleksa.

Hipotezo smo z uspešno pripravo modelov struktur protein-proteinskih interakcij in njihovo analizo potrdili ter tako pokazali komplementarnost eksperimentalnih in bioinformatskih metod v preučevanju molekularnih mehanizmov razvoja bolezni.

Ključne besede: SARS-CoV-2, ORF8, protein-proteinske interakcije, napoved proteinske strukture, molekulsko sidranje proteinov

(6)

Human infection with novel SARS-CoV-2 virus was first reported in December of 2019, with the subsequent rapid spread of the virus all over the world. SARS-CoV-2 differs greatly from the rest of coronaviruses in the accessory protein ORF8, which is encoded by one of the most variable parts of the viral genome. With the spread of infection, new variants of the virus and ORF8 emerged that could be found all over the world and also in Slovenia. New variants often result in an altered course of viral infection or COVID- 19 disease development, which can be utilised in the research of molecular mechanisms of viral proteins. Many ORF8 interactors have been identified, among others also ADAM9, PLOD2, ITGB1, TGFB1 and IL17RA, which all take part in physiological processes that symptoms of infection with SARS-CoV-2 are attributed to. This research focused on ORF8 modifications S24L, Y73C and L84S, which appeared the most frequently in the earliest variants. Protein interaction analysis consisted of experimental yeast-two-hybrid screening, followed by current computational molecular docking methods, which were the focal point of this thesis. Algorithms I-TASSER and AlphaFold were used for protein structure prediction of unknown structures of target proteins together with experimentally solved structures of the rest of the target proteins, which were then used for protein docking on servers HADDOCK and ClusPro in order to successfully complete our bioinformatic analysis. In the experimental part of this research, certain mutations resulted in deviation from the referential result, which was used as a basis for the hypothesis that the modified amino acids which result in a deviated experimental result, are part of the interaction surface of the protein complex. Our hypothesis has been confirmed by successful modelling of mentioned protein-protein interactions and analysis of the produced models. We therefore showed complementarity of experimental and bioinformatic methods in research of molecular mechanisms of disease.

Keywords: SARS-CoV-2, ORF8, protein-protein interactions, protein structure prediction, protein docking

(7)

1.1 ORF8 1

1.2 Napoved modela strukture proteina 5

1.2.1 I-TASSER 6

1.2.2 AlphaFold2 7

1.3 Molekulsko sidranje 8

1.3.1 ClusPro 8

1.3.2 HADDOCK 9

2 NAMEN DELA IN HIPOTEZE 11

3 METODE 13

3.1 Izbor programov 13

3.2 Izbira in priprava struktur 13

3.2.1 ORF8 14

3.2.2 ADAM9 14

3.2.3 PLOD2 14

3.2.4 ITGB1 15

3.2.5 TGFB1 15

3.2.6 IL17RA 16

3.3 Priprava podatkov 16

3.4 Molekulsko sidranje 16

3.4.1 ClusPro 2.0 16

3.4.2 HADDOCK 17

3.5 Izbor in analiza modelov 17

3.5.1 Modeli struktur proteinov 17

3.5.2 Modeli protein-proteinskih interakcij 17

(8)

4.1.1 ADAM9 21

4.1.2 PLOD2 22

4.2 Modeli interakcij ORF8 s tarčnimi proteini 23

4.2.1 ADAM9 23

4.2.2 PLOD2 25

4.2.3 ITGB1-Nt 27

4.2.4 ITGB1-Ct 28

4.2.5 TGFB1-Ct 30

4.2.6 TGFB1-LAP 31

4.2.7 TGFB1 33

4.2.8 IL17RA 34

5 RAZPRAVA 37

6 ZAKLJUČEK 41

7 LITERATURA 43

(9)

3D tridimenzionalni prikaz

ADAM9 disintegrinska metaloproteaza 9

AIR ang. Ambiguous Interaction Restraints

CAPRI ang. Critical Assessment of Predicted Interactions CASP ang. The Critical Assessment of Structure Prediction

ER endoplazemski retikulumu

FnIII_D2 fibronektinska domena 2 tipa III

GDT_TS preizkus globalne oddaljenosti (ang. Global Distance Test Total Score)

IL17 interlevkin-17

IL17RA receptor A za interlevkin-17

IRMSD koren povprečne vrednosti kvadratov razlik za stično površino ISRE z interferonom stimulirani odzivni elementi

ITGB1 integrin beta-1

LAP z latenco povezan peptid

MHCI molekule poglavitnega histokompatibilnostnega kompleksa I ORF8 pomožni protein 8

PDB podatkovna baza kristalografskih struktur (ang. Protein Data Base)

RMSD koren povprečne vrednosti kvadratov razlik

SARS-CoV Hud akutni respiratorni sindrom-koronavirus (ang. Severe acute respiratory syndrome-coronavirus)

SARS-CoV-2 Hud akutni respiratorni sindrom-koronavirus-2 (ang. Severe acute respiratory syndrome-coronavirus-2)

TGFB transformirajoči rastni faktor beta Y2H dvohibridni sistem kvasovke

(10)

Aminokislina Enočrkovna oznaka Tričrkovna oznaka

alanin A Ala

arginin R Arg

asparagin N Asn

aspartat D Asp

cistein C Cys

fenilalanin F Phe

glicin G Gly

glutamin Q Gln

glutamat E Glu

histidin H His

izolevcin I Ile

levcin L Leu

lizin K Lys

metionin M Met

prolin P Pro

serin S Ser

tirozin Y Tyr

treonin T Thr

triptofan W Trp

valin V Val

(11)

1

1 UVOD

Hud akutni respiratorni sindrom-koronavirus-2 (SARS-CoV-2) je najnovejši koronavirus iz družine Coronaviridae, ki je bil pri človeku prvič potrjen decembra 2019 v Wuhanu na Kitajskem. Sledila je hitra širitev okužbe in razglasitev pandemije z več kot 120 milijoni potrjenih primerov, ki se kažejo kot bolezen COVID-19. SARS-CoV-2 je enoverižen, pozitiven RNA virus z ovojnico. Genom je dolg približno 30.000 baznih parov in zapisuje za 4 strukturne, 16 nestrukturnih in 6 pomožnih proteinov – ORF3a, ORF6, ORF7a, ORF7b, ORF8 ter ORF10. SARS-CoV-2 se od drugih koronavirusov najbolj razlikuje v proteinu ORF8, zato je ta s posebnim poudarkom obravnavan pri raziskovanju mehanizma razvoja bolezni [1]. Preučevanje molekularnega mehanizma proteinov zahteva dobro poznavanje reakcij in poti, v katerih ti sodelujejo, za kar so ključni proteinski interaktorji. S tem namenom se je razvilo veliko metod za detekcijo protein-proteinskih interakcij. Zelo pogosto je uporabljen dvohibridni sistem kvasovke (Y2H), ki še posebej v obliki visokozmogljive metode omogoča detekcijo fizičnih interakcij z velikim naborom interaktorjev. Skupaj z računskimi metodami modeliranja struktur proteinov, molekulskega sidranja in molekulske dinamike tako predstavlja celovit pristop k analizi protein-proteinskih interakcij [2].

1.1 ORF8

Pomožni protein ORF8 je eden izmed beta-koronavirusnih proteinov, ki se najhitreje spreminja in razvija. Podobnost z ORF8 SARS-CoV je manj kot 20-odstotna. Bistvena je sprememba biološke enote iz monomera pri SARS-CoV v dimer pri SARS-CoV-2, ki se je pojavila šele nedavno pri gostitelju pred preskokom na človeka [3]. V referenčnem genomu SARS-CoV-2 (NC_045512.2) je zapisan s 366 nukleotidi med mestoma 27.894 in 28.259 in se prevede v 121 aminokislin dolg protein [4].

Organizacija strukture nakazuje podobnost z imunoglobulinsko domeno, za katero je značilen N-terminalni hidrofobni signalni peptid za uvoz v transmembranski prostor, jedro proteina s strukturo ß-nagubanih ravnin in C-terminalna domena. ORF8 temu sledi s prisotnostjo signalnega peptida v zaporedju 1-15 in z dvema ß-nagubanima ravninama, ki ju tvori preostali del aminokislinskega zaporedja 16-121 [5].

Protein tvori dimer, ki je povezan z intermolekularno disulfidno kovalentno vezjo prek aminokislinskih ostankov cisteina na 20. mestu. Strukturo dodatno stabilizirajo še 4 solni mostički, 12 vodikovih vezi in hidrofobne interakcije preostalih aminokislin v interakcijski površini, ki pokriva 1320 Å2. Znotraj vsakega monomera so trije disulfidni mostički, ki stabilizirajo strukturo dveh ß-nagubanih antiparalelnih ravnin. Manjšo ß- ravnino sestavljajo trakovi ß2, ß5 in ß6, večjo pa ß3, ß4, ß7 in ß8. Trakova ß8 in ß1 sta del interakcijske površine homodimera in prispevata večino medmolekulskih interkacij.

Dopolnijo jih še aminokislinski ostanki zanke med ß3 in ß4 [1],[3],[5]. K stabilizaciji strukture doprinese hidrofobna interakcija Val117 skupaj z dvema solnima mostičkoma

(12)

2

na vsaki strani, ki se vzpostavita med Arg115 in Asp119. Po 2 H-vezi prispeva interakcija med Phe120 in Ala51 ter Arg52, ta pa tvori še dodatno H-vez z Ile121. Med Lys53 in Ser24 se prav tako vzpostavi H-vez (slika 1). Enak motiv interakcij se zaradi simetrije ponovi na obeh koncih interakcijske površine dimera [3].

V ORF8 je zanimiva variabilna aminokislina Leu84, ki je med dvema evolucijsko ohranjenima ostankoma s specifično vlogo. Aminokislinski ostanek Cys83 namreč sodeluje v znotrajmolekulski disulfidni vezi, Pro85 pa zavzema cis-konformacijo.

Ohranjena geometrija segmenta povzroči izpostavitev stranske verige aminokisline na 84.

mestu topilu, kar omogoči potencialen prispevek k funkcionalnosti proteina (slika 2).

Možnost vpliva na funkcijo se pripisuje tudi aminokislini Tyr73, ki se nahaja v za SARS- CoV-2 specifičnem delu zaporedja med 71. in 76. aminokislino. Te tvorijo motiv

73YIDI76, ki v kristalni strukturi sodeluje v velikem številu hidrofobnih interakcij, kar privede do stabilizacije nekovalentnega kompleksa [3]. Znotraj specifičnega motiva

78NYT80 predstavlja Asn78 mesto za N-glikozilacijo (slika 2) [1].

Slika 1. Prikaz interakcijske površine dimernega kompleksa ORF8. Izpostavljeni so vsi aminokislinski ostanki, ki sodelujejo pri stabilizacij. Oranžno so označene vezi, ki jih je samodejno zaznal program ChimeraX 1.2.5. Rumeno je označena disulfidna vez, rdeče so označeni kisikovi, modro pa dušikovi atomi.

Vse slike so pripravljene s programom ChimeraX 1.2.5.

(13)

3

Prisotnost številnih disulfidnih vezi in transmembranskega signalnega peptida nakazuje na sekrecijo proteina ali njegovo prisotnost v endoplazemskem retikulumu (ER), kjer so ustrezni oksidacijski pogoji za pravilno zvitje proteina in vzpostavitev disulfidnih mostičkov [1],[5]. V ER ORF8 interagira s številnimi proteini gostitelja, vendar ima tudi sekretorno naravo, saj deluje kot antigen pri okužbi z virusom. Protitelesa proti ORF8 so namreč eden od glavnih pokazateljev okužbe s SARS-CoV-2 [3]. Zaporedje proteina sestavlja 63 hidrofilnih in 58 hidrofobnih ostankov. Kljub večjemu deležu hidrofilnih ostankov pa so analize dostopnosti topila pokazale, da protein ni izjemno topen, kar vodi do agregacije proteinov v celici. Poleg tega je pri Wuhanski in Britanski varianti virusa SARS-CoV-2 ohranjen Val77, ki se je že pri SARS-CoV izkazal kot ključen za proteinsko agregacijo, ta pa doprinese k povečanemu citokinskemu odzivu imunskega sistema [1]. Prehod virusov živalskega izvora na človeka je pogosto posledica ustrezne mutacije, ki omogoči uspešno preživetje in razmnoževanje v novem gostitelju. Uvajanje mutacij namreč vodi h genomski raznolikosti in prilagoditvi gostitelju ter različnim okoljem [6]. Ocena pogostosti substitucij nukleotidov za virus SARS-CoV-2 je 0,91 × 10-3 zamenjav na nukleotidno mesto na leto, kar je za RNA-virus relativno malo [7]. Lokus ORF8 je med vsemi beta-koronavirusi ena od najbolj variabilnih regij genoma. V virusu SARS-CoV-2 je bolj variabilen samo zapis za gen S. Kljub temu je v genskem zapisu za ORF8 264 (72,1 %) ohranjenih mest in 102 variabilni mesti, ki so razpršena po zaporedju [4]. Najbolj ohranjena je regija 85PFTINCQE92, ki se nahaja v jedru proteina [1]. V prvih 6 mesecih spremljanja razvoja virusa so bile v ORF8 zabeležene že številne mutacije, ki so vodile k spremembi aminokislinskega zaporedja. Najpogostejša je bila zamenjava levcina za serin

Slika 2. Prikaz strukture kovalentnega dimernega ORF8. Modro je obarvana veriga A, zeleno pa veriga B. Izpostavljen in svetlo zeleno obarvan je aminokislinski ostanek Asn78, ki je mesto N-glikozilacije. Vijolično sta obarvana trimera 83CLP85 z izpostavljeno aminokislino Leu84, ki se ji pripisuje pomen v proteinski funkciji.

(14)

4

na 84. mestu (L84S), naslednja je bila S24L, nato pa so z manjšo pogostostjo sledile še V62L, A65S in druge [6]. Ne glede na to sta za zamenjavo najbolj dovzetni aminokislini treonin in triptofan. V delu zaporedja, ki predstavlja signalni peptid, prevladujejo mutacije, ki vodijo v zamenjave med hidrofobnimi aminokislinami, v zaporedju funkcionalnega dela proteina pa so najpogostejše zamenjave hidrofobnih aminokislin s hidrofilnimi [1]. Poleg mutacij so se pojavljale tudi delecije, ki vplivajo na dolžino proteina

[6]. Pogostost pojavnosti zamenjave L84S odseva prisotnost najbolj variabilnega mesta gena za ORF8, ki je nukleotid 28.144. V 85 % vseh analiziranih zaporedij je prisoten uracil (U), v preostalih 15 % pa citozin (C), kar povzroči zamenjavo aminokisline [4]. Virusni proteini so pri okužbah poglavitni razlog za spremembe, povezane z naravno in adaptivno imunostjo, kar lahko vodi do poškodb tkiva in posledično resnejših zapletov.

Potrjen je bil inhibitorni vpliv ORF8 na z interferonom stimulirane odzivne elemente (ISRE) in s tem inhibicija protivirusne poti gostitelja regulirane z interferonom tipa I. Kot antagonist ISRE-elementov promotorja transkripcijskih faktorjev genov, ki vodijo k vzpostavitvi protivirusnega stanja v celici, virusu omogoči izogibanje imunskemu sistemu gostitelja in s tem uspešno replikacijo ter preživetje [8]. Opažene so bile tudi znižane ravni molekul poglavitnega histokompatibilnostnega kompleksa I (MHCI) v testiranih celičnih linijah po okužbi s SARS-CoV-2. Preprečitev prezentacije virusnih antigenov je uspešen način izogiba delovanju citotoksičnih limfocitov. S tem je omogočeno preživetje gostiteljskih celic in uspešna replikacija virusa. Za dosego te funkcije protein ORF8 interagira z molekulami MHCI in jih usmeri v lizosomsko razgradno pot prek iniciacije avtofagije s proteinom Beclin 1 [9]. Integrativne genomske analize so že kmalu po pojavu virusa omogočile celostno analizo molekularnih funkcij virusnih proteinov s poudarkom na interakcijah z gostiteljevim proteomom. Kot pomembna se je izkazala interakcija ORF8 s transformirajočim rastnim faktorjem beta (TGFB), ki je specifična za SARS-CoV-2. Pomen se ji pripisuje zaradi razlage pojava pljučne fibroze, ki pogosto spremlja težji potek bolezni ob okužbi z virusom in jo povzroča neravnovesje signalne poti TGFB. Učinki so še ojačani z aktivacijo integrinske poti. Integrin beta 1 (ITGB1) namreč inducira od TGFB odvisno transformacijo pljučnih epitelijskih celic v mezenhimske, kar vodi k razvoju pljučne fibroze [10],[11].

Prav tako je bilo pokazano, da ORF8 fizično interagira z interlevkin-17 receptorjem A (IL17RA) ter tako vpliva na signalno pot proinflamatornega interlevkina-17 (IL-17), ki je povezan z nastankom citokinskega viharja. Do interakcije pride preko fibronektinske domene 2 tipa III (FnIII_D2) [12]. Uravnavanje signala IL-17 poteka preko izpusta ekstracelularne domene receptorja IL17RA v obliki topnega proteina iz celice, ki nato veže IL-17 in inhibira signal. Pri tem procesu sodelujejo proteaze, ki omogočijo cepitev transmembranske oblike receptorja. Tovrstni encim je metaloproteaza ADAM9, ki je bila prav tako potrjena kot interaktor proteina ORF8 [13].

(15)

5

1.2 Napoved modela strukture proteina

Proteini so pomembne biološke makromolekule, ki so sestavljene iz najrazličnejših kombinacij 20 aminokislin. Leta 1973 so postavili tako imenovano »termodinamsko hipotezo«, ki predpostavlja, da je tridimenzionalna (3D) struktura nativnega proteina pri fizioloških pogojih tista, ki da najnižjo prosto Gibbsovo energijo sistema. To določajo intramolekularne interakcije, ki pa so odvisne od aminokislinskega zaporedja [14]. Izjemna raznolikost zaporedij se tako kaže v 3D-strukturah molekul, ki določajo njihove specifične biološke funkcije. Poznavanje strukture proteinov je tako bistvenega pomena za študij bioloških procesov in razvoj terapevtskih molekul [15]. V ta namen se je razvilo več sofisticiranih eksperimentalnih tehnik, ki pa so finančno in časovno potratne [16]. To je privedlo do razkoraka med številom poznanih aminokislinskih zaporedij in številom določenih struktur proteinov. Zahvaljujoč novim metodam sekvenciranja je v zbirki UniProt zbranih 180 milijonov aminokislinskih zaporedij, v zbirki Protein Data Bank (PDB) pa le 158,000 eksperimentalno rešenih struktur [15]. Posledično je v ospredje molekularne in računske biologije prišel razvoj računskih metod, ki bi omogočile hitro in natančno napoved strukture na podlagi aminokislinskega zaporedja ter tako pripomogle k razrešitvi problema proteinskega zvijanja. Do sedaj razvite metode se glede na glavni pristop delijo na modeliranje na osnovi homologije, prepoznavanje zvitja ali threading in ab initio modeliranje. Dalje se delijo še na modeliranje na osnovi matrice in prosto modeliranje [17].

Modeliranje na osnovi homologije uporablja evolucijsko povezanost proteinov za iskanje matrice za napoved strukture. Princip temelji na dejstvu, da se visoka podobnost aminokislinskih zaporedij odraža v visoki podobnosti struktur. Metode threading so uporabne za napovedovanje struktur proteinov, ki imajo z najboljšim tarčnim zaporedjem manj kot 30-odstotno podobnost in uporabijo že rešene strukture proteinov za prileganje aminokislinskega zaporedja. Ab initio metode pa 3D-strukturo proteina napovejo zgolj na podlagi aminokislinskega zaporedja in temeljijo na termodinamski hipotezi. Te metode upoštevajo vse vezne in nevezne interakcije, ki lahko sodelujejo pri zvijanju proteina ter izberejo model z najnižjo energijo [17].

Dobro uveljavljen preizkus za metode napovedi strukture je The Critical Assessment of Structure Prediction (CASP), ki se od prvega srečanja raziskovalcev s področja napovedovanja proteinskih struktur leta 1994 odvija vsako drugo leto. Za oceno napovedi CASP med drugim uporablja Global Distance Test Total Score (GDT_TS), ki predstavlja delež pravilno določenih Cα-atomov znotraj napovedane strukture glede na eksperimentalno določeno strukturo [18]. Vrednosti nad 80 % predstavljajo večinsko pravilno napovedano strukturo, vrednosti pod 20 % pa predstavljajo naključne modele struktur [19]. Prijavljene skupine raziskovalcev pred potekom srečanja z lastnimi metodami pripravijo napovedi proteinskih struktur, ki so bile v istem času eksperimentalno razrešene, vendar ne objavljene. Na podlagi primerjave napovedanih

(16)

6

modelov z eksperimentalno določeno strukturo tako posamezne metode ocenijo. Od začetka prvih srečanj je bil ves čas viden razvoj področja z vedno boljšimi napovedmi struktur, bistven prelom pa se je zgodil na 13. srečanju leta 2018, ko je bil prvič predstavljen algoritem AlphaFold, ki temelji na uporabi umetne inteligence in nevronskih mrež [20]. Napovedovanje proteinskih struktur z visoko natančnostjo je bilo v preteklosti strogo povezano z modeliranjem na podlagi homologije, ab initio modeliranje je namreč do nedavnega dosegalo veliko slabše rezultate. Do leta 2016 so najvišje GDT-ocene modelov dosegle 47,1 %, na zadnjem CASP14 srečanju leta 2020 pa je bil predstavljen izboljšan algoritem AlphaFold2 skupine DeepMind, ki je pri strukturah vseh težavnosti dosegel GDT-ocene modelov nad 90 %, kar je primerljivo z eksperimentalnim določanjem struktur [19].

1.2.1 I-TASSER

Iterative Threading Assembly Refinement (I-TASSER) je avtomatiziran algoritem za napoved 3D-strukture proteinov in je nenehno med najbolje ocenjenimi metodami v preizkusih CASP. Temelji na modeliranju na podlagi matrice, od drugih spletnih strežnikov pa se razlikuje po integraciji strukturnih in funkcijskih podatkov, ki omogočajo lažjo interpretacijo napovedanih struktur. Za uspešno napoved končnega modela strukture potečejo 4 bistveni koraki: threading, sestavljanje fragmentov strukture, izpopolnjevanje modela in funkcijska anotacija strukture [21].

Threading je metoda za iskanje strukturno podobnih proteinov v primeru, ko ni na voljo proteinov s homolognim aminokislinskim zaporedjem. Pri tem se zaporedje obravnavanega proteina prilega na znane strukture proteinov v zbirkah in vsako prileganje oceni [22]. Strežnik I-TASSER za to uporablja več različnih programov, ki najboljši model opišejo z oceno Z. Ta se uporabi za izbiro najboljših modelov, ki se prenesejo v naslednji korak modeliranja strukture. Uspešno določeni fragmenti strukture se iz matričnih struktur izrežejo, nedoločene zanke pa se modelirajo ab initio. Sestavljanje v pravilno konformacijo je pospešeno z redukcijo modela strukture na Cα-atome, stranske skupine aminokislin pa so obravnavane zgolj kot center mase. Vodilo simulacije sestavljanja strukture so empirično pridobljeni energijski pogoji znanih struktur, izračunane omejitve oddaljenosti ter dodatne omejitve, ki jih lahko določi uporabnik. Na ta način se izgradi več tisoč možnih konformacij strukture z nizko energijo. V procesu izpopolnjevanja modela se predlagane konformacije združijo v skupke glede na podobnost terciarne strukture, za vsak skupek pa se izgradi še povprečna struktura skupka. Povprečne strukture 5 največjih skupkov z najnižjimi energijami ponovno vstopijo v cikel sestavljanja strukture iz fragmentov za izgradnjo čimbolj realističnega modela. Končni modeli so obdelani še na ravni atomov za pridobitev končnega 3D-modela strukture. Vsak model se oceni s C-vrednostjo in B-faktorjem, ki opišeta kvaliteto celotnega modela in premik stranskih skupin. V zadnjem koraku se modele struktur še funkcijsko anotira na podlagi primerjave lokalnih delov strukture in celotne geometrije molekule s strukturnimi elementi v zbirki BioLip. Modelom struktur se pripiše genske ontologije, številko EC in

(17)

7

predvidi se vezavna mesta, kar predstavlja dodano vrednost spletnega strežnika I- TASSER [21].

V zadnjem CASP-ocenjevanju (CASP14) je v nadgrajeni obliki D-I-TASSER zasedel 17.

mesto, kar ga je označilo za 3. najboljši spletni strežnik [19]. Izboljšanje uspešnosti napovedi modelov strukture je posledica nadgradnje algoritma s strojnim učenjem, ki omogoči sestavo omrežij razdalj med aminokislinskimi ostanki in vodikovih vezi v strukturi. Podatki so pridobljeni iz poravnave več zaporedij homolognih proteinov, zato je za izboljšanje napovedi modela ključno zadostno število homolognih aminokislinskih zaporedij [23].

Poleg spletnih strežnikov so se tudi preostale metode napovedovanja strukture usmerile v uporabo podatkov, ki odražajo evolucijsko zgodovino proteinov in z uporabo nevronskih mrež omogočajo izjemno natančno napoved strukture. Poravnava več zaporedij in spremljanje zamenjav aminokislin v zaporedju omogočajo sklepanje o interakcijah med aminokislinskimi ostanki. Poleg tega pridobimo še napovedi o torzijskih kotih vezi med Cα-atomi in razdalje med posameznimi ostanki, kar predstavlja nadgradnjo informacije o interakciji ter tako doprinese k večji specifičnosti strukture [16].

1.2.2 AlphaFold2

Serija algoritmov, ki sestavljajo nevronsko mrežo AlphaFold2, je bila predstavljena leta 2020 in je kot prva računska metoda dosegla napoved modela strukture primerljivega z eksperimentalno določitvijo tridimenzionalnih struktur proteinov. Izjemno natančnost napovedi metoda doseže z združevanjem evolucijskih, fizikalnih in geometrijskih omejitev struktur ter uporabo najnovejših arhitektur in postopkov učenja mrež.

AlphaFold2 napove 3D-koordinate atomov v strukturi na podlagi aminokislinskega zaporedja proteina in homolognih zaporedij v zbirkah ter se uči na strukturah v zbirki PDB. Uporablja minimalno usmeritev z integriranimi funkcijami za opis strukture, zato je mreža pri napovedi strukture uspešna tudi v primerih omejene količine ali celo odsotnosti podatkov iz PDB [24].

Nevronsko mrežo sestavljata algoritem Evoformer, kjer pride do poravnave več zaporedij in izdelave matrik poravnave več zaporedij ter matrik, ki predstavljajo pare aminokislinskih ostankov v strukturah. Izdelane matrike uporabi strukturni modul, kjer se s pripisom rotacij in translacij vsakemu aminokislinskemu ostanku izgradi struktura proteina. Pri vstopu v strukturni modul so namreč vsi podatki o legi aminokislin v začetnem stanju v isti točki, iz katere se skozi 8 plasti modula generira vedno bolj izpopolnjen model strukture. Evoformer sestavlja 48 plasti, glavni doprinos h končni uspešnosti napovednega modela pa predstavlja izmenjava informacij med obema naboroma podatkov v vsaki plasti, kar omogoči vzpostavitev povezave med evolucijskimi in prostorskimi podatki. V vsaki od plasti algoritem izboljša informacijo za izgradnjo modela, dokler ne doseže najboljših možnih parametrov strukture. Velik doprinos k

(18)

8

natančnosti strukture predstavlja tudi iterativno izpopolnjevanje informacije prek celotne mreže z večkratnim vnašanjem izhodnih podatkov modula nazaj v isti modul [24].

Pomanjkljivosti metode so predvsem posledica uporabe poravnave več zaporedij, saj uspešnost napovedi strukture pade, če je v naboru poravnave manj kot 30 zaporedij [24].

1.3 Molekulsko sidranje

Molekulsko sidranje oziroma docking je računska metoda za napovedovanje 3D-strukture proteinskih kompleksov. Poznavanje mehanizma interakcije je pomembno v preučevanju molekularno bioloških procesov in za namen razvoja zdravil in cepiv. Še posebej uspešno je ob upoštevanju znanih informacij o interakciji molekul, ki jih pridobimo z eksperimentalno določenimi strukturami molekul v kompleksih, mutagenezo in metodo dvohibridnega sistema kvasovke [25]. Računske metode so pomembne za premostitev vrzeli med količino določenih aminokislinskih zaporedij proteinov in napovedanih struktur, zato poteka njihov razvoj izjemno hitro. V zadnjem obdobju se je ta podobno kot pri napovedovanju struktur proteinov tudi na področju molekulskega sidranja usmeril v uporabo umetne inteligence. Za ocenjevanje metod molekulskega sidranja je leta 2001 zaživel Critical Assessment of Predicted Interactions (CAPRI), ki strokovnjakom s področja omogoča preverjanje uspešnosti razvitih metod in napredek v modeliranju 3D- kompleksov velikih molekul [26].

Molekulsko sidranje po principu delovanja delimo na ab initio sidranje in od matrice odvisno sidranje. Ab initio sidranje temelji na iskanju termodinamsko najbolj ugodnega modela kompleksa, ki ima najnižjo prosto Gibbsovo energijo. Ta način je primeren za interakcije proteinov, pri katerih ne pride do bistvenih konformacijskih sprememb ob vezavi. Molekulsko sidranje na podlagi matrice pa temelji na evolucijski ohranitvi strukture in funkcije proteinov ter predpostavki, da homologni interakcijski partnerji z več kot 30-odstotnim ujemanjem v zaporedju interagirajo na podoben način. Ta način je uporaben, če so na voljo strukture ustreznih modelov homolognih kompleksov [27]. Algoritmi proizvedejo na tisoče modelov, ki so ocenjeni in na podlagi tega razvrščeni.

Sestava ocene je bistvena za uspešen zaključek modeliranja, saj naj bi najbolje ocenjeni modeli predstavljali konformacijo kompleksa, ki je najbolj podobna nativni in so zato običajno izbrani za nadaljnjo analizo. Običajni pristopi vrednotenja vključujejo elektrostatske, van der Waalsove in hidrofobne interakcije ter celotno energijo modela

[25].

1.3.1 ClusPro

Spletni strežnik ClusPro je samodejni program za prosto ab initio molekulsko sidranje, ki skozi vsa ocenjevanja CAPRI zaseda najvišja mesta. Modeliranje poteka v treh pomembnih korakih: sidranje togega telesa, združevanje najboljših 1000 modelov v

(19)

9

skupke na podlagi izračunanega korena povprečne vrednosti kvadratov razlik (RMSD) in izboljševanje modela strukture z minimizacijo energije [27].

Sidranje togega telesa poteka z algoritmom PIPER, ki temelji na hitri Fourierovi transformaciji, ki omogoča sidranje proteinov brez predhodnih informacij o strukturi kompleksa. Pri tem je center mase receptorja postavljen v izhodišče sferičnega koordinatnega sistema, medtem ko ligand zavzema vse vrednosti rotacij in translacij po mreži v prostoru s 6 prostostnimi stopnjami. Posamezen translacijski premik ima velikost 1 Å, število preverjenih rotacij pa doseže 70.000, kar da 109-1010 možnih konformacij in s tem modelov strukture kompleksa. Za izbiro najboljših modelov so ti ovrednoteni s funkcijo, ki vsebuje odbojne in privlačne prispevke k van der Waalsovim interakcijam, elektrostatsko energijo in predvideno spremembo energije zaradi odstranitve molekul vode iz modela. V naslednjem koraku je za grupiranje izbranih 1000 najboljših modelov strukture kompleksa z najnižjo energijo, za vsak par izbranih struktur pa je nato izračunana vrednost RMSD za stično površino (IRMSD). Model strukture, ki ima največje število sosednjih modelov znotraj oddaljenosti 9 Å IRMSD, je določen za center skupka, vsi sosednji modeli pa so dodani v ta isti skupek in odstranjeni iz algoritma.

Postopek združevanja se ponavlja do porabe vseh modelov, ki so na koncu urejeni v do 30 skupkov in razvrščeni od najbolj do najmanj številčnega skupka. V zadnjem koraku pride še do minimizacije energije struktur z odstranjevanjem steričnih ovir [27].

Rezultati so predstavljeni v štirih sklopih in se med seboj razlikujejo glede na tip upoštevane biofizikalne interakcije med proteinoma v kompleksu. Uporabnik lahko glede na lastno presojo izbere prikaz rezultatov za uravnotežene sile, prednostno elektrostatske, prednostno hidrofobne ali za van der Waalsove in elektrostatske sile. Interpretacija rezultatov se pri algoritmu ClusPro bistveno razlikuje od drugih programov, saj je večja verjetnost vsebovanja pravilnega modela proporcionalna velikosti skupka in ne najnižji energiji modela [27].

Omejitev metode predstavlja uporaba algoritma PIPER v primerih kompleksov, kjer interakcija privede do bistvene konformacijske spremembe proteinov, česar algoritmi na podlagi sidranja togega telesa ne morejo upoštevati [27].

1.3.2 HADDOCK

HADDOCK je metoda za molekulsko sidranje proteinov, ki jo usmerjajo znani podatki o stični površini interakcije molekul ali o njihovi orientaciji. Pogosto so to eksperimentalno pridobljene informacije iz tehnik masne spektrometrije in jedrske magnetne resonance. V primeru, da teh ni na voljo, pa jih lahko nadomesti bioinformatska napoved aminokislinskih ostankov, ki sodelujejo v interakciji. Prednost te metode je upoštevanje možnosti konformacijske spremembe strukture molekul ob vezavi v kompleks.

Pridobljene podatke o interakciji molekul uporabimo kot seznam aktivnih in pasivnih aminokislinskih ostankov, kar program prevede v Ambiguous Interaction Restraints

(20)

10

(AIR), ki usmerjajo molekulsko sidranje. V izračun celotne energije modela je vpeljan še izraz za AIR, ki je odvisen od efektivne razdalje med molekulama [28].

Proces sidranja poteka v treh korakih, ki vodijo k izbiri najbolje ocenjenih napovedanih struktur interakcije. Modeli so pridobljeni v prvem koraku prek algoritma sidranja togega telesa in izbire modelov z najnižjo energijo. Ti vstopijo v naslednji korak, kjer pride do minimizacije energije z modifikacijo torzijskih kotov v proteinski strukturi. Pri tem je dovoljena delna fleksibilnost strukture za upoštevanje možnosti spremembe konformacije ob interakciji. V končnem koraku se modele izboljša še ob prisotnosti topila [28]. Modeli so na vsakem koraku ocenjeni in razvrščeni v skupke glede na oceno HADDOCK. Ta vsebuje utežene prispevke van der Waalsovih in elektrostatskih interakcij, zakopane površine proteinov, kršitev AIR in popravek za odstranitev topila [29]. Posamezni prispevki so navedeni za vsak skupek in predstavljajo povprečne vrednosti najboljših štirih napovedanih struktur v skupku. K oceni je dodana tudi vrednost Z, ki predstavlja razpršenost vrednosti HADDOCK in je pomembna pri interpretaciji rezultata [28].

(21)

11

2 NAMEN DELA IN HIPOTEZE

Namen diplomske naloge je bil pripraviti modele kompleksov, ki nastanejo zaradi binarnih protein-proteinskih interakcij proteina ORF8 iz virusa SARS-CoV-2 s tarčnimi proteini človeka. Uporabiti smo želeli sodobne računske metode za napovedovanje struktur proteinov ter metode molekulskega sidranja. Želeli smo pripraviti modele, s katerimi bi lahko razložili eksperimentalne podatke (tabela 1) istih interakcij, pridobljenih z dvohibridnim sistemom kvasovke. Obravnavali smo proteine, ki sodelujejo v molekularnih procesih, povezanih z razvojem bolezni COVID-19 ter specifične mutacije virusnega proteina ORF8, ki so bile prisotne v potrjenih variantah virusa na področju Slovenije.

Naša hipoteza je, da aminokisline, ki so bile podvržene zamenjavi zaradi uvedbe mutacije in prispevajo k drugačnemu rezultatu od referenčnega, sodelujejo v interakcijski površini proteinov ter pomembno prispevajo k stabilizaciji kompleksa.

(22)

12

(23)

13

3 METODE

3.1 Izbor programov

Analizo smo začeli z izbiro ustreznih orodij. Splošne podatke o obravnavanih proteinih in njihova aminokislinska zaporedja smo pridobili iz zbirke UniProt. Osredotočili smo se predvsem na strukturne podatke; zanimala nas je domenska sestava proteinov in celična lokalizacija posameznih domen z namenom priprave ustreznih modelov, ki sovpadajo s pripravljenimi interaktorji eksperimentalnih podatkov [30].

Za modeliranje eksperimentalno še nedoločenih struktur smo zaradi preteklih izkušenj uporabili program I-TASSER, že določene ali napovedane strukture pa smo pridobili iz spletne zbirke Protein Data Base (PDB) [31].

Za molekulsko sidranje smo na podlagi pregleda literature izbrali programa ClusPro in HADDOCK, ki na ocenjevanju CAPRI konsistentno dosegata najboljše rezultate in sta zato pogosta izbira pri tovrstnih analizah [2],[32],[33].

Molekulsko sidranje v HADDOCK zahteva določitev aktivnih ostankov struktur, za kar smo uporabili pripadajoče orodje CPORT istega razvijalca, kar je zagotovilo kompatibilnost podatkov. Poleg tega smo uporabili še njihov progam PRODIGY za izračun vezavne afinitete napovedanih kompleksov [34],[35].

Ogled in analizo struktur ter končnih modelov smo opravili s programskim orodjem PyMOL 2.4.1 in ChimeraX 1.2.5, ki omogočata vizualizacijo struktur makromolekul [36],

[43].

3.2

Izbira in priprava struktur

Modeliranje interakcij in silico je dopolnitev raziskave interakcij virusnega ORF8 proteina s humanimi proteini z metodo dvohibridnega sistema kvasovke (Y2H), zato smo si prizadevali pripraviti strukture, ki bi omogočale vpogled v naravo interakcije posameznih parov proteinov v realnem sistemu in s tem tudi aplikacijo dognanj. Držali smo se načela izbire eksperimentalno določene strukture, če je ta na voljo, in modeliranja strukture v primeru nerazrešene strukture. Pregled spletne zbirke PDB je podal ustrezne strukture za proteine človeka ORF8, ITGB1, TGFB1 in IL17RA, ADAM9 in PLOD2 pa struktur eksperimentalno še nimata določenih.

Strukturi proteinov ADAM9 in PLOD2 smo določili na podlagi homolognega modeliranja z orodjem I-TASSER. V času pisanja naloge pa sta bili naknadno objavljeni še strukturi proteinov napovedani z metodo strojnega učenja AlphaFold [24].

(24)

14 3.2.1 ORF8

Referenčna varianta proteina ORF8, ki je bil pri molekulskem sidranju uporabljen kot receptor, ima eksperimentalno dobro določeno strukturo, zato smo model PDB: 7JX6 prenesli iz zbirke PDB. Med dvema modeloma smo se za izbranega odločili zaradi boljše ločljivosti. Strukturo smo uredili v programu PyMOL, pri čemer smo izbrisali vezane molekule vode in posamične kovinske atome. ORF8 je v strukturi dimera, zato sta v istem modelu strukture verigi A in B, ki imata isto aminokislinsko zaporedje 18-121. To preprečuje nadaljnjo uporabo na strežniku HADDOCK, saj mora biti za uspešno sidranje vsak aminokislinski ostanek unikatno oštevilčen, v modelu strukture pa je lahko le ena molekula receptorja na enkrat. Zaporedje verige B smo zato preštevilčili na način, da smo vsaki aminokislini v zaporedju 18-121 s funkcijo alter v PyMOL prišteli vrednost 200 in tako dobili nespremenjeno aminokislinsko zaporedje oštevilčeno od 218 do 321. S tem smo omogočili upoštevanje celotne strukture pri molekulskem sidranju.

3.2.2 ADAM9

Aminokislinsko zaporedje človeškega proteina ADAM9 smo pridobili iz zbirke UniProt.

Uporabili smo N-končni del zaporedja, ki predstavlja ekstracelularno domeno po post- translacijskih modifikacijah [37]. Aminokislinsko zaporedje 206-697 smo vnesli v za to namenjen obrazec na strežniku I-TASSER, dostopnem na uradni spletni strani, ter projekt poimenovali. Ohranili smo že nastavljene parametre ter oddali zaporedje v modeliranje strukture. Ob zaključku modeliranja smo dobili 4 različno dobre modele strukture proteina. Med temi smo najboljšega izbrali na podlagi najnižje C-vrednosti [21].

Iz zbirke AlphaFold smo prenesli model strukture AF-Q13443-F1. S programom PyMOL smo zaporedje skrajšali, da je struktura ustrezala ciljnemu zaporedju 206-697.

Tako pridobljena modela smo med seboj strukturno poravnali z orodjem znotraj programa ChimeraX 1.2.5 in ju primerjali.

3.2.3 PLOD2

Za določitev ustrezne strukture proteina PLOD2 smo uporabili celotno aminokislinsko zaporedje brez signalnega peptida, ki smo ga pridobili iz zbirke UniProt. Zaporedje, ki je obsegalo aminokisline 26-737, smo vnesli v obrazec na spletni strani strežnika I- TASSER. Projekt smo poimenovali in ohranili vse začetne nastavitve. Po koncu modeliranja smo dobili 2 modela, med katerima smo izbrali tistega z nižjo C-vrednostjo.

Napovedan model strukture AF-O00469-F1 smo prenesli iz zbirke AlphaFold in ga pregledali s programom PyMOL. Zaporedje strukture smo ustrezno skrajšali, da se je ujemalo s tarčnim zaporedjem.

(25)

15

Modela smo strukturno primerjali z orodjem znotraj programa ChimeraX 1.2.5 in dobili RMSD-vrednost poravnave struktur.

3.2.4 ITGB1

Za pripravo modelov interakcije transmembranskega proteina ITGB1 z ORF8 smo ločeno obravnavali N-končni del zaporedja, ki predstavlja ekstracelularno domeno, in C-končni del zaporedja, ki predstavlja citoplazemsko domeno. Oba dela strukture sta bila že večkrat eksperimentalno določena z metodo rentgenske kristalografije, zato smo ju prenesli iz zbirke PDB.

Kot ekstracelularno domeno smo izbrali model PDB: 4WK0, zaradi popolnosti vsebovanega zaporedja N-končne domene, najboljše ločljivosti strukture in preprostosti liganda.

Po istem kriteriju smo za citoplazemsko domeno izbrali model strukture PDB: 3G9W.

Vsakega izmed modelov struktur smo pregledali s programom PyMOL in v prvem koraku izbrali in odstranili vse molekule vode iz strukture, nato pa smo odstranili še majhne organske vezane ligande in posamične kovinske atome, da smo dobili eksperimentalno določeno strukturo ekstracelularne domene znotraj zaporedja 21-465 in citoplazemsko domeno, ki ji pripada zaporedje 750-789.

3.2.5 TGFB1

Strukturo proteina TGFB1, ki je bila prav tako že večkrat eksperimentalno določena, smo pripravili v obliki 3 modelov. Uporabili smo modele, določene z rentgensko difrakcijo, ki smo jih prenesli iz zbirke PDB. Držali smo se kriterija izbire modelov glede na ločljivost, vsebovano zaporedje in vezane ligande.

Za analizo strukture celotnega proteina smo uporabili model PDB: 5VQP, ki smo ga pregledali v programu PyMOL in odstranili vezan organski ligand. Struktura ustreza zaporedju 30-390.

Posamično smo pripravili še modela struktur za citoplazemsko domeno proteina, ki ji pripada C-končno zaporedje 279-390. Kot reprezentativen smo izbrali model PDB:

4KV5, iz katerega smo izbrisali ligand, vezan v kompleks ter vse razen ene enote citoplazemske domene iz multimerne strukture.

Kot tretji del smo pripravili model strukture z latenco povezanega peptida (LAP), ki predstavlja zaporedje 30-278. Uporabili smo model PDB: 6P7J, ki ni potreboval dodatne obdelave.

(26)

16 3.2.6 IL17RA

Eksperimentalno določen model ekstracelularne domene strukture proteina IL17RA smo izbrali na podlagi dobre ločljivosti in vsebovanega zaporedja. Strukturo PDB: 5N9B smo prenesli iz zbirke PDB in v programu PyMOL ostranili vsebovane molekule vode ter organske ligande. Pripravili smo model strukture, ki prestavlja N-končni del zaporedja 33-318.

3.3 Priprava podatkov

Vse pripravljene modele struktur smo za nadaljnje molekulsko sidranje na strežniku HADDOCK analizirali s pripadajočim algoritmom CPORT za določitev aminokislinskih ostankov, ki tvorijo interakcijsko površino posameznega proteina. Pomembna je bila določitev aktivnih aminokislinskih ostankov, prek katerih je možna vzpostavitev intermolekularne interakcije [29].

Posamezen model strukture za vsak protein smo v pdb-obliki naložili na strežnik in algoritem nastavili na visoko občutljivost primerno za HADDOCK. Rezultate smo shranili v obliki poimenovanega seznama aktivnih in pasivnih aminokislinskih ostankov.

3.4 Molekulsko sidranje

Interakcije med ORF8 in tarčnimi proteini človeka smo modelirali na spletnih strežnikih ClusPro in HADDOCK. Za oba načina smo uporabili iste strukture, ki so bile ustrezno pripravljene za uporabo na serverju.

3.4.1 ClusPro 2.0

Pri modeliranju interakcij v ClusPro 2.0 smo vedno kot receptor izbrali strukturo ORF8 in jo naložili v obrazec, kot ligand pa je vedno nastopal tarčni protein. Projekt smo enoznačno poimenovali in ohranili že nastavljene parametre za sidranje molekul. Prav tako nismo določili aktivnih ostankov za usmeritev modeliranja interakcije. Projekt je bil sprejet na strežnik, kjer smo spremljali napredek in rezultate dobili v obliki več modelov interakcije proteinov s pripadajočimi ocenami posameznega modela.

Za oceno modelov smo vedno izbrali možnost uravnoteženih (ang. balanced) prispevkov k energiji modela. Prenesli smo 10 najboljših modelov, ki so samodejno prikazani v rezultatih s pripadajočo oceno vsakega [27].

Ocene modelov vsakega kompleksa proteinov smo prenesli in uvozili v program MS Excel, kjer smo zbirali tudi podatke nadaljnjih analiz.

(27)

17 3.4.2 HADDOCK

Podobno kot pri molekulskem sidranju s ClusPro 2.0 smo postopali tudi pri uporabi strežnika HADDOCK. Kot »molekulo 1« smo vedno izbrali strukturo ORF8. V obrazec smo jo ustrezno pripravljeno naložili sami in med možnostmi izbrali uporabo vseh verig v strukturi, saj je ta sestavljena iz dveh polipeptidnih verig. »Molekulo 2« pa je vedno predstavljal tarčni protein, ki smo ga prav tako naložili v urejeni obliki in izbrali uporabo celotne strukture. V nadaljevanju smo v obrazec za sidranje za vsak protein posebej naložili v naprej pripravljeno zaporedje aktivnih aminokislinskih ostankov, ki smo jih pridobili s programom CPORT. Vse ostale možnosti in omejitve pri molekulskem sidranju smo ohranili privzete [29].

Rezultate smo dobili kot seznam 10 najboljših skupkov modelov s po štirimi najboljšimi modeli struktur kompleksov vsakega skupka. Prenesli smo najboljši model strukture vsakega izmed 10 skupkov. Vsak je bil opisan še s parametri za oceno kvalitete modela, ki smo jih dodali v zvezek programa MS Excel.

3.5 Izbor in analiza modelov

3.5.1 Modeli struktur proteinov

Modela struktur proteinov ADAM9 in PLOD2 smo med napovedanimi izbrali glede na vrednost C, s katero server I-TASSER oceni uspešnost napovedi. Ta je običajno v intervalu [-5, 2], višja vrednost pa predstavlja boljšo napoved strukture. Vrednosti nad - 1,5 običajno predstavljajo pravilno topologijo modela [21]. Za vsak protein smo izbrali model strukture z najvišjo oceno C.

3.5.2 Modeli protein-proteinskih interakcij

Končne modele smo izbrali skozi več krogov različnih analiz.

V prvem koraku smo v seznamu zbrali ocene 10 najboljših modelov, ki sta jih predlagala programa za molekulsko sidranje. Za modele, pripravljene s programom ClusPro, smo za nadaljnjo obravnavo izbrali 3-4 modele z najbolj ustreznimi parametri. Izbor smo naredili na podlagi velikosti skupka, ki pripada modelu in najnižje energije modela v skupku.

Prednostno smo upoštevali velikost skupka, ki je bolj reprezentativna za kvaliteto napovedi interakcije [27]. Pri skupkih približno iste velikosti pa smo upoštevali še najnižjo energijo. Modele pripravljene s programom HADDOCK smo izbrali glede na Z-vrednost, ki združuje vse ocene modela in je tako dober pokazatelj kvalitete modela. Nižja kot je ocena Z, boljši je model [28]. Izbrali smo vse modele z negativno Z-vrednostjo in tako ponovno izbrali 3-4 modele za vsako interakcijo.

(28)

18

V naslednjem koraku smo vse izbrane modele analizirali s programom PyMOL, pri čemer smo se osredotočili na iskanje kontaktov med proteinoma v kompleksu prek 24., 73. in 84. ostanka proteina ORF8. Te aminokisline so bile namreč v eksperimentalnem poskusu podvržene zamenjavam zaradi mutageneze, saj preverjamo njihov pomen pri interakcijah virusa z gostiteljem (tabela 1). V programu PyMOL smo za iskanje interakcij uporabili funkcijo find polar contacts, omejeno na obravnavane aminokislinske ostanke. Najdene interakcije smo skupaj z njihovo dolžino zabeležili. Za ostanke, ki jim program ni samodejno pripisal interakcije, smo ročno pregledali okolico stranske verige aminokisline ter izmerili najkrajšo razdaljo med ostankoma, kjer bi lahko nastala vez. Te rezultate smo prav tako zapisali v tabelo. Za naslednji korak analize smo izločili nekaj modelov, kjer je bil vzorec interakcij in oddaljenosti v popolnem nasprotju z eksperimentalnimi rezultati (tabela 1).

V nadaljevanju smo preostalim modelom na spletnem strežniku PRODIGY izmerili vezavno afiniteto in disociacijsko konstanto [35]. Vrednosti smo zabeležili v obstoječo tabelo.

V zadnjem koraku smo glede na ocene modelov, vzorec interakcij in oddaljenosti ter jakosti vezave, izbrali model, ki ustreza eksperimentalnim podatkom. Kljub odsotnosti interakcij smo pripravili tudi model kompleksa ORF8-TGFB1, saj je celoten protein sestavljen iz C-končne regije in LAP-proteina s katerima posamično pride do interakcije.

Zanimala nas je strukturna razlaga odsotnosti interakcije (tabela 1). Pri izbiri modelov smo upoštevali jakost zaznane interakcije ter odstopanja od interakcije z referenčnim ORF8. Šibkim interakcijam smo pripisali modele z večjimi konstantami disociacije, odstopanju od referenčne interakcije pa modele, ki so glede na možnost tvorbe vezi prek specifične aminokisline razložili drugačen rezultat. Med ustreznimi modeli smo za vsak par interaktorjev na podlagi najboljše ocene modela izbrali končni model.

Tabela 1: Prikaz rezultatov analize interakcij z Y2H. S sivo so označena polja, kjer do interakcije med varianto proteina ORF8 in tarčnim proteinom ni prišlo, temno zeleno so označena polja s potrjenimi močnimi interakcijami, svetlo zelo pa polja kjer je prišlo do šibke interakcije. Z rdečo obrobo so izpostavljeni rezultati interakcij, ki odstopajo od referenčnega rezultata. (Zavodnik T., Doberšek K., Petrovič U., neobjavljeni rezultati).Varianta Signalni peptid ADAM9-Nt PLOD2 ITGB1-Nt ITGB1-Ct TGFB1-Ct TGFB1-LAP TGFB1 IL17RA-Nt

DA NE DA NE DA NE DA NE DA NE Ref.

L84S S24L L84S + S24L

Y73C

(29)

19

Končne modele smo analizirali še s programom ChimeraX 1.2.5 ter ponovno poiskali možne interakcije izbranih aminokislinskih ostankov ali izmerili njihovo oddaljenost od potencialnega interaktorja. V istem programu smo pripravili tudi slike modelov [36].

(30)

20

(31)

21

4 REZULTATI

4.1 Napoved strukture ADAM9 in PLOD2

4.1.1 ADAM9

Modeliranje napovedi struktur proteina ADAM9 je potekala na spletnem strežniku I- TASSER, ki strukturo napove na osnovi matrice. Izbrali smo najboljši model, ki je prikazan na sliki 3 in je obarvan z modro. Vrednost C-modela je 0,85.

V nadaljevanju so bile objavljene še strukture človeških proteinov napovedane z algoritmom AlphaFold, ki z uporabo strojnega učenja napove strukture primerljive z eksperimentalno določitvijo. Na sliki 3 je model obarvan rumeno.

Napovedana modela sta si najbolj podobna v delu brez sekundarne strukture in se ujemata v sami napovedi sekundarnih struktur. Se pa bistveno razlikujeta po položaju napovedanih α-vijačnic, ki pripadajo N-koncu zaporedja in so na sliki 3 zgoraj levo ter v položaju ß-ploskve spodaj levo.

Strukturno poravnavo obeh modelov smo izvedli v programu ChimeraX 1.2.5. Vrednost poravnave modelov RMSD = 1,057.

Slika 3. Strukturna poravnava modelov proteina ADAM9. Prikazana je poravnava struktur proteina ADAM9, napovednih s programoma I-TASSER in AlphaFold.

Modro je obarvan model strukture pripravljen z I-TASSER, rumeno pa je obarvana struktura, napovedana z AlphaFold.

(32)

22

Za modeliranje kompleksa z ORF8 smo uporabili oba napovedana modela strukture ADAM9.

4.1.2 PLOD2

Za napoved modelov smo tako kot za ADAM9 uporabili programa I-TASSER in AlphaFold.

Ob napovedi modela strukture z I-TASSER smo sami izbrali najboljši model z najvišjo C-vrednostjo. Model je na sliki 4 obarvan z modro in ima vrednost C = 1,92.

Po objavi napovedi struktur proteinov z AlphaFold smo oba modela strukture primerjali s strukturno poravnavo. Iz slike 4 je razvidno, da je ujemanje obeh napovedi zelo dobro, saj so napovedane iste sekundarne strukture, ki so enako orientirane. Odstopanja so vidna le v zankah, ki α-vijačnice povezujejo.

Uspešnost poravnave je opisana z vrednostjo RMSD, ki za PLOD2 znaša 0,698.

Poravnava je bila narejena v programu ChimeraX 1.2.5.

Kljub temu, da sta si napovedana modela strukture PLOD2 zelo podobna, smo za molekulsko sidranje s proteinom ORF8 uporabili oba.

Slika 4. Strukturna poravnava modelov proteina PLOD2. Prikazana je strukturna poravnava za modelov za protein PLOD2 napovednih s programoma I-TASSER in AlphaFold. Modro je obarvan model strukture, pripravljen z I-TASSER, rumeno pa je obarvana struktura, napovedana z AlphaFold.

(33)

23

4.2 Modeli interakcij ORF8 s tarčnimi proteini

4.2.1 ADAM9

Izbrali smo najboljša modela interakcije ORF8 in ADAM9 za vsako od napovednih struktur tarčnega proteina. Oba modela sta bila pripravljena na strežniku HADDOCK. V tabeli 2 so prikazani parametri modelov, s katerimi strežnik oceni komplekse.

Za izračun afinitete vezave smo strukturi kompleksov naložili na strežnik PRODIGY.

Model, v katerem sodeluje struktura ADAM9, napovedana z I-TASSER, ima vrednost proste Gibbsove energije ΔG = -12,2 kcal/mol, čemur ustreza disociacijska konstanta KD

= 1,1 × 10-9. Vrednosti vezave izračunane za model, v katerem nastopa struktura ADAM9, napovedana z AlphaFold, pa so ΔG = -12,9 kcal/mol in KD = 2,3 × 10-12. Izbrana modela smo še strukturno analizirali in ugotovili, da se v območju idealne interakcijske površine 5 Å nahaja stranska veriga aminokisline iz ORF8 Leu84 [38]. V modelu z ADAM9, napovedanim z I-TASSER, pripada Leu84 verigi B, v modelu, napovedanem z AlphaFold, pa verigi A. Izmerili smo oddaljenost stranske verige Leu84 od najbližjega ustreznega aminokislinskega ostanka ORF8, s katerim bi lahko ob zamenjavi za Ser tvorila vez. V obeh primerih se je za primernega izkazal Thr, kot je razvidno iz slike 5. V modelu s strukturo ADAM9, pripravljeno z I-TASSER, je razdalja med Leu84 iz ORF8 in Thr470 iz ADAM9 3,14 Å (slika 5, desno), v modelu interakcije s strukturo, napovedano z AlphaFold, pa je razdalja med Leu84 in Thr471 4,68 Å (slika 5, levo).

Tabela 2: Ocena modelov kompleksa ORF8-ADAM9 na strežniku HADDOCK.

I-TASSER AlphaFold

Ocena HADDOCK 68,4 +/- 4,7 62,7 +/- 11,0

Velikost skupka 18 6

RMSD-vrednost strukture z najnižjo energijo 16,7 +/- 0,2 16,2 +/- 0,0 Van der Waalsova energija -55,4 +/- 4,5 -90,7 +/- 8,0

Elektrostatska energija -232,2 +/- 32,3 -499,5 +/- 65,8 Energija desolvatacije -5,5 +/- 4,3 -22,9 +/- 6,9 Energija kršitve omejitev 1757,3 +/- 72,5 2762,3 +/- 101,4

Zakopana površina 2372,2 +/- 128,3 4267,6 +/- 86,1

Ocena Z -1,4 -1,1

ADAM9

(34)

24

Pregled strukture kompleksa je pokazal interakcijo prek drugačne interakcijske površine.

V obeh modelih pa je razvidno, da se ORF8 veže v žep strukture ADAM9. Do interakcije z obravnavano aminokislino pride v modelu s strukturo ADAM9 iz I-TASSER prek verige A ORF8, v modelu s strukturo ADAM9 iz AlphaFold pa prek verige B (slika 6).

Slika 5. Oddaljenost Leu84 iz ORF8 do najbližjega aminokislinskega ostanka proteina ADAM9. Prikazana in rumeno obarvana je najkrajša izmerjena razdalja med aminokislinama, ki bi ob zamenjavi L84S lahko sodelovali v H-vezi. Modro je obarvan ORF8, sivo pa ADAM9. Na desni strani je prikaz iz kompleksa, kjer je bila struktura ADAM9 napovedana z I-TASSER, na levi strani pa z AlphaFold. Na desni sliki je vidna še samodejno zaznana in modro označena H-vez med Ser24 in Ser476.

Slika 6. Modela struktur kompleksa ORF8 in ADAM9. Prikazana sta najboljša napovedana modela interakcije med proteinoma ORF8 in ADAM9. Na desni je struktura ADAM9, napovedana z I-TASSER, na levi pa z AlphaFold. Struktura ADAM9 je obarvana sivo in v prikazu površine. Modro je obarvana struktura ORF8 z označenimi obravnavanimi aminokislinami. Oranžno je obarvan in izpostavljen aminokislinski ostanek Leu84.

(35)

25 4.2.2 PLOD2

Izbrana najboljša modela za kompleks interakcije ORF8 s PLOD2 sta bila napovedana s spletnim strežnikom HADDOCK. Izbrali smo modela, v katerih sodeluje struktura PLOD2, napovedana na strežniku I-TASSER, ter model s strukturo, napovedano z AlphaFold. Oba modela kompleksov sta bila ocenjena s parametri, prikazanimi v tabeli 3.

Dodatno smo modele analizirali na spletnem strežniku PRODIGY za izračun jakosti vezave. Za model interakcije, v kateri sodeluje model PLOD2, pripravljen z I-TASSER, smo dobili ΔG = -16,4 kcal/mol in KD = 9,8 × 10-13. Model strukture PLOD2, napovedan z AlphaFold, pa je sodeloval v interakciji, za katero smo izračunali vezavno afiniteto ΔG

= -15,1 kcal/mol in KD = 8,7 × 10-12.

V programu ChimeraX 1.2.5 smo pregledali napovedani strukturi obeh kompleksov.

Osredotočili smo se na obravnavane aminokisline iz eksperimentalnih podatkov, še posebej na ORF8 Tyr73, ki v tem kompleksu daje odstopanje od reference (tabela 1). Pri uvedbi spremembe Y73C namreč prej zaznana šibka interakcija popolnoma izgine. V obeh modelih je v obsegu interakcijske površine samo stranska veriga aminokislinskega ostanka Tyr73 verige A. Najbližji, za interakcijo ustrezen aminokislinski ostanek strukture PLOD2, ki je bila napovedana z I-TASSER, je Arg602, ki je oddaljen 5,48 Å.

V strukturi PLOD2, napovedani z AlphaFold, pa je ustrezen aminokislinski ostanek Asp736, ki je oddaljen 5,01 Å (slika 7).

Tabela 3: Ocena modelov kompleksa ORF8-PLOD2 na strežniku HADDOCK.

I-TASSER AlphaFold Ocena HADDOCK 66,6 +/- 34,8 19,9 +/- 11,1

Velikost skupka 18 5

RMSD-vrednost strukture z najnižjo energijo 4,2 +/- 0,4 15,0 +/- 0,0 Van der Waalsova energija -107,6 +/- 12,1 -125,2 +/- 10,0

Elektrostatska energija -282,3 +/- 66,0 -353,4 +/- 34,1 Energija desolvatacije -48,2 +/- 6,2 -50,9 +/- 2,9 Energija kršitve omejitev 2788,6 +/- 155,5 2665,8 +/- 108,8

Zakopana površina 3507,3 +/- 311,5 4038,5 +/- 126,3

Ocena Z -0,5 -1,4

PLOD2

(36)

26

Ogled celotne strukture modela interakcije pokaže veliko podobnost napovedanih modelov kompleksov za obe strukturi PLOD2. Protein ORF8 se v skoraj identični orientaciji veže na sredino PLOD2 v nekakšen vezavni žep (slika 8). Interakcijski površini obeh modelov se prekrivata.

Slika 7. Razdalje med aminokislinskimi ostanki, ki potencialno sodelujejo v interakciji. Z rumeno sta prikazani najkrajši izmerjeni razdalji med Tyr73 iz verige A proteina ORF8 in ustreznim ostankom PLOD2. Modro je obarvana struktura ORF8, zeleno pa PLOD2. Na desni je izsek iz modela, kjer v interakciji sodeluje struktura PLOD2, napovedana z I-TASSER, na levi pa struktura PLOD2, napovedana z AlphaFold.

Slika 8. Strukturi najboljših modelov interakcije ORF8 s PLOD2. V načinu prikaza površine molekule sta prikazana napovedana modela interakcij ORF8, ki je obarvan modro in PLOD2, ki je obarvan zeleno. Z oranžno je obarvana aminokislina Tyr73, ki se ji pripisuje vlogo v interakciji. Na desni je model kompleksa s strukturo PLOD2, ki je bila napovedana z I-TASSER, na levi pa s strukturo napovedano z AlphaFold.

(37)

27 4.2.3 ITGB1-Nt

Najboljši model strukture interakcije ORF8 z N-končno domeno ITGB1 je napovedal spletni strežnik ClusPro, ki uporablja metodo ab initio molekulskega sidranja. Ocenjen je bil glede na velikost pripadajočega skupka in njegovo energijo.

Izbrani model je pripadal drugemu največjemu skupku s 66 modeli, najnižja energija skupka pa je bila -9990 relativnih enot. Za izračun jakosti vezave smo strukturo naložili na strežnik PRODIGY, ki je podal rezultata o vezavni afiniteti ter disociacijski konstanti ΔG = -14,4 kcal/mol in KD = 2,6 × 10-11.

Strukturo modela smo pregledali v programu za vizualizacijo s posebnim ozirom na aminokisline, ki so bile obravnavane v eksperimentalnem poskusu (tabela 1). Ugotovili smo, da nobena od aminokislin na 24., 73. oziroma 84. mestu ORF8 ne sodeluje v interakcijski površini z oddaljenostjo do 5 Å. Protein ORF8 se veže na konec strukture ITGB1 in se strukturno dobro prilega prek komplementarnosti površin (slika 9).

Za interpretacijo interakcijske površine smo to prikazali kot elektrostatske in hidrofobne kontakte. Razvidna je dobra stabilizacija kompleksa prek elektrostatskih interakcij. Prav tako pa je struktura stabilizirana tudi prek hidrofobnih stikov (slika 10).

Slika 9. Prikaz modela interakcije ORF8 z ITGB1-Nt. Modro je obarvana struktura proteina ORF8, v kateri so na desni s poimenovanjem označene obravnavane aminokisline. Rjavo je obarvana struktura ITGB1-Nt v načinu prikaza površine molekule.

(38)

28 4.2.4 ITGB1-Ct

Model interakcije proteina ORF8 s C-terminalno domeno ITGB1, ki se je izkazal za najbolj ustreznega, je bil napovedan na strežniku HADDOCK. Parametri za opis modela so zbrani v tabeli 4.

Afiniteto vezave in disociacijsko konstanto smo izračunali na strežniku PRODIGY ter dobili vrednosti ΔG = -11,9 kcal/mol in KD = 1,9 × 10-9.

Slika 10. Hidrofobna in elektrostatska interakcijska površina ORF8 z ITGB1-Nt.

Modro obarvan in v prikazu verige je ORF8, rjavo obarvana pa je struktura ITGB1- Nt. Na levi strani je prikazana hidrofobna interakcijska površina, pri kateri so z rumeno obarvana hidrofobna področja, z modro po hidrofilna. Na desni je prikaz elektrostatske površine med proteinoma, kjer rdeča področja predstavljajo področja z negativnim nabojem, modra pa so pozitivno nabita področja.

Tabela 4: Ocena modela kompleksa ORF8-ITGB1-Ct na strežniku HADDOCK.

ITGB1-Ct

Ocena HADDOCK 49,0 +/- 12,4

Velikost skupka 7

RMSD-vrednost strukture z najnižjo energijo 5,2 +/- 0,0 Van der Waalsova energija -54,5 +/- 3,0

Elektrostatska energija -247,9 +/- 14,9 Energija desolvatacije -10,4 +/- 1,1 Energija kršitve omejitev 1634,5 +/- 134,8

Zakopana površina 2195,3 +/- 27,5

Ocena Z -0,7

(39)

29

Model strukture interakcije smo pregledali z ustreznim orodjem in pri tem ugotovili neposredno bližino stranske verige Leu84 iz B verige ORF8 ter Leu754 iz strukture ITGB1-Ct (slika 11). Druge obravnavane aminokisline v interakciji ne sodelujejo.

Pregled tipov interakcij pokaže, da je kompleks dobro hidrofobno in elektrostatsko stabiliziran v področju α-vijačnice (slika 12). Strukturi ne interagirata prek celotne površine vijačnice, pač pa samo prek koncev.

Slika 11. Model interakcije proteinov ORF8 z ITGB1-Ct. Z modro je predstavljen model ORF8, v katerem so s poimenovanjem označene obravnavane aminokisline.

Rdeče pa je obarvana struktura ITGB1-Ct. Iz prikaza z verigo sta izpostavljeni aminokislini Leu84 (ORF8) in Leu754 (ITGB1-Ct).

Slika 12. Hidrofobna in elektrostatska površina interakcije ORF8 z ITGB1-Ct. Z modro verigo je prikazana struktura ORF8, kot celotna hidrofobna ali elektrostatska površina pa ITGB1-Ct, skupaj z delom ORF. Na levi je prikaz hidrofobnih (rumena) in hidrofilnih (modra) kontaktov, na desni pa elektrostatska površina. Modro je obarvan pozitiven naboj, rdeče pa negativen.

(40)

30 4.2.5 TGFB1-Ct

Za opis interakcije med ORF8 in C-terminalno domeno TGFB1 smo izbrali model, napovedan s spletnim strežnikom ClusPro.

Model kompleksa je pripadal največjemu skupku, ki je vseboval 52 struktur. Najnižja energija skupka pa je bila -10.863 relativnih enot. Na strežniku PRODIGY smo izračunali jakost vezave kompleksa ter dobili rezultata ΔG = -16,3 kcal/mol ter KD = 1 × 10-12. Strukturo interakcije smo ročno pregledali z ozirom na obravnavane interakcije. Izmerili smo oddaljenost stranskih verig aminokislinskih ostankov Ser24 oziroma Tyr73 do najbližjega ostanka iz strukture TGFB1-Ct, s katerim bi lahko tvoril vez. V ORF8 verigi A je Tyr73 3,73 Å oddaljen od Tyr90, v verigi B pa je Leu84 3,47 Å oddaljen od Tyr65 iz TGFB1-Ct (slika 13).

Protein ORF8 se s komplementarno obliko veže v strukturo TGFB1 ter z njo tvori veliko interakcijsko površino. Strukturi se dobro ujemata in imata možnost dveh pomembnih kontaktov, kar je razvidno iz slike 14.

Slika 13. Meritve oddaljenosti med aminokislinskimi ostanki obeh proteinov. Z rumeno sta prikazani obe meritvi dolžin med ostanki, ki bi lahko sodelovali v vezi. Na levi strani je prikazana razdalja med Tyr73 verige A iz ORF8 (modra) in Tyr90 iz TGFB1, na levi strani pa je prikazana razdalja med Leu84 iz verige B in Tyr65 iz tarčnega proteina (vijolična).

Reference

POVEZANI DOKUMENTI

Na problem pojmovanja hrane opozarjajo tudi Skribe Dimec, Gostinčar Blagotinšek, Florjančič in Zajc (2003), ko pravijo, da večina otrok in odraslih misli, da dobijo rastline hrano

V diplomski nalogi smo ugotovili, da ima elektrotransfekcija celic humanega adenokarcinoma debelega črevesa (celična linija LoVo) s plazmidno DNA, ki kodira molekule miRNA,

V diplomski nalogi smo proučevali optične, anatomske in biokemijske lastnosti listov pri štirih različnih vrstah rastlin, ki uspevajo na območju Cerkniškega jezera; navadni

Najučinkovitejši način preprečevanja oslovskega kašlja je vzdrževanje visokega deleža cepljenih v skupnosti. Za zaščito je potrebnih pet odmerkov cepiva. Cepljenje

V diplomski nalogi smo na posameznih primerih prikazali uporabo desetih metod v podjetju Alples, ki sodijo k skupini za odločanje (teorija odločitev, linearno

Slika 8: Proteinski profil celičnega ekstrakta pivske kvasovke Saccharomyces pastorianus generacije 1 z označenimi 2-D lisami diferencialno izraženih proteinov, ki smo

V hipotezi diplomske naloge smo predvidevali, da pH rastnega medija vpliva na profil zunajceličnih proteinov termofilne arheje Aeropyrum pernix in da so proteini prisotni v

V nalogi smo proučevali vrstno sestavo 584 bakterijskih izolatov, ki smo jih osamili iz 102 vzorcev humanega kolostruma prostovoljk, ki so sodelovale v raziskavi Vloga humanega