U
NIVERZA VL
JUBLJANIF
AKULTETA ZA KEMIJO IN KEMIJSKO TEHNOLOGIJOMAGISTRSKO DELO
Samo Purič
Ljubljana, 2022
U
NIVERZA VL
JUBLJANIF
AKULTETA ZA KEMIJO IN KEMIJSKO TEHNOLOGIJOMAGISTRSKI ŠTUDIJSKI PROGRAM 2. STOPNJE BIOKEMIJA
Prepoznavanje proteinov s pomočjo strukturne prilagodljivosti: primerjava vezanja intrinzično nestrukturiranih proteinov in kameloidnih protiteles
MAGISTRSKO DELO
Samo Purič
M
ENTOR: doc. dr. San Hadži
Ljubljana, 2022
IZJAVA O AVTORSTVU
magistrskega dela
Spodaj podpisani Samo Purič sem avtor magistrskega dela z naslovom: Prepoznavanje proteinov s pomočjo strukturne prilagodljivosti: primerjava vezanja intrinzično nestrukturiranih proteinov in kameloidnih protiteles.
S svojim podpisom zagotavljam, da:
• je magistrsko delo rezultat mojega raziskovalnega dela pod mentorstvom doc.
dr. Sana Hadžija;
• sem poskrbel, da so dela in mnenja drugih avtorjev, ki jih uporabljam v
predloženem magistrskem delu, navedena oziroma citirana v skladu z navodili;
• se zavedam, da je plagiatorstvo, v katerem so tuje misli oziroma ideje
predstavljene kot moje lastne, kaznivo po zakonu (Zakon o avtorski in sorodnih pravicah – uradno prečiščeno besedilo (ZASP-UPB3) (Ur. list RS, št. 16/2007);
• sem poskrbel za slovnično in oblikovno korektnost magistrskega dela;
• je elektronska oblika magistrskega dela identična tiskani obliki magistrskega dela.
V Ljubljani, 29.1.2022 Podpis avtorja:
Magistrsko delo je zaključek Magistrskega študijskega programa 2. stopnje Biokemija.
Delo je bilo opravljeno na Fakulteti za kemijo in kemijsko tehnologijo UL.
Senat UL FKKT je za mentorja imenoval doc. dr. Sana Hadžija.
Recenzenta: prof. dr. Jurij Lah, doc. dr. Miha Pavšič
Komisija za oceno in zagovor magistrskega dela
Predsednik komisije: doc. dr. Miha Pavšič
Član: prof. dr. Jurij Lah
Član: doc. dr. San Hadži
Prepoznavanje proteinov s pomočjo strukturne prilagodljivosti: primerjava vezanja intrinzično nestrukturiranih proteinov in kameloidnih protiteles
Povzetek:
V magistrskem delu smo s strukturnega in termodinamskega vidika preučili dva primera vezanja proteinov, pri katerih pride do prepoznavanja s strukturno prilagoditvijo enega od partnerjev.
V prvem delu smo se osredotočili na interakcije med intrinzično nestrukturiranimi proteini (IDP-ji), ki ob vezavi na globularno tarčo tvorijo izključno α-vijačnico. S pomočjo literaturnih podatkov in naših lastnih meritev smo sestavili reprezentativen vzorec α-heličnih IDP-jev. Ugotovili smo, da je delež α-vijačnice v nevezani obliki znaten, IDP-ji so torej predzviti, ob vezavi pa se delež α-vijačnice poveča. Prisotnost takšne prehodne helične strukture v prostem stanju je iz termodinamskega vidika ugodna, saj zmanjša delež za katerega se morajo IDP-ji ob vezavi na tarčo še dodatno zviti. Izkaže se, da je razlog za opažene visoke deleže urejene strukture v nevezanem stanju prisotnost hidrofobnega aminokislinskega ostanka levcina in nekaterih vezavnih motivov, ki so sestavni del intrinzično neurejenih trans-aktivacijskih domen (še posebej pogost je levcinski motiv LXXLL). Levcin namreč zaradi svojih lastnosti pomembno vpliva na stabilnost predzvite strukture, prav tako pa tvori pomembne interakcije, ki stabilizirajo kompleks α-heličnih IDP-jev s tarčo.
V drugem delu naloge pa smo s pomočjo izotermne titracijske kalorimetrije (ITC) analizirali interakcije med fragmenti kameljih protiteles in njihovimi tarčami (antigena HigB2 in MazF). Termodinamske prispevke vezanja smo poskušali pojasniti s pomočjo lastnosti aminokislinskega zaporedja zank CDR. Ugotovili smo, da je strukturna prilagodljivost hipervariabilnih regij sicer prisotna, vendar pa ne predstavlja poglavitnega prispevka k visoki afiniteti vezave. Razmeroma visoka vsebnost hidrofobnih ak-ostankov v regijah CDR3 in povezava števila le-teh z afiniteto vezave kažeta na to, da imajo interakcije nanoteles s pripadajočimi antigeni najverjetneje izrazit hidrofoben značaj.
Ključne besede: vezanje proteinov, strukturna prilagodljivost, intrinzično nestrukturirani proteini, nanotelesa
Protein recognition by conformational plasticity: a comparison of binding by intrinsically disordered proteins and with camelid antibodies
Abstract:
The presented thesis examines two cases of protein binding from a structural and a thermodynamic point of view in which protein recognition occurs through the structural adaptation of one of the binding partners.
First, we focused on the interactions of intrinsically disordered proteins (IDPs) which consist of sequences that fold into α-helices upon binding to their globular protein targets.
Using data from literature and from our own measurements, we compiled a representative dataset of α-helical IDPs. We found that IDPs in general possess significant residual helicity in their unbound state (pre-folded structure) and gain helicity upon binding their targets. The presence of such a transient helical structure in the unbound state is advantageous from a thermodynamic point of view, as it reduces the entropic penalty of folding and thereby increases interaction affinity. It turns out that the reason for the observed ordered structure in the unbound state is, among other things, the presence of leucine – a hydrophobic amino acid residue – and some typical binding motifs that are an integral part of intrinsically disordered transactivation domains (the LXXLL leucine motif is especially common). Due to its properties, leucine significantly affects the stability of the pre-folded structure and forms important stabilizing interactions between an IDP and its target.
In the second part of this thesis, the interactions of camelid antibody fragments (nanobodies) and their targets (HigB2 and MazF antigens) were analyzed using isothermal titration calorimetry (ITC). The goal was to explain the thermodynamic contributions of binding using the properties of the amino acid sequences of the hypervariable regions (CDR loops) of nanobodies. We observed that some conformational plasticity of the hypervariable loops is present but found that it doesn’t represent a major contribution to the high binding affinity of nanobodies. A relatively high content of hydrophobic amino acid residues in the CDR3 regions and its apparent connection with binding affinity both suggest a pronounced hydrophobic character of nanobody-antigen interactions.
Keywords: protein binding, structural plasticity, intrinsically disordered proteins, nanobodies
Kazalo
1 Uvod ... 1
1.1 Vezava proteinov ... 1
1.2 Intrinzično nestrukturirani proteini ... 3
1.3 Nanotelesa ... 5
1.4 Spektropolarimetrija (CD) ... 7
1.5 Izotermna titracijska kalorimetrija (ITC) ... 8
2 Namen dela ... 11
3 Materiali in metode ... 13
3.1 Bioinformatski del ... 13
3.1.1 Podatkovna baza α-heličnih peptidov ... 13
3.1.2 Analiza na osnovi aminokislinskega zaporedja ... 13
3.1.3 Heličnost v nevezanem in vezanem stanju ... 15
3.1.4 Vezavni motivi ... 15
3.2 Eksperimentalni del ... 16
3.2.1 Priprava vzorcev ... 16
3.2.2 ITC ... 16
4 Rezultati in razprava ... 19
4.1 Vezanje intrinzično nestrukturiranih proteinov ... 19
4.1.1 Zbirka podatkov α-heličnih IDP-jev ... 19
4.1.2 Sekvenčna karakterizacija zbirke α-heličnih motivov IDP ... 20
4.1.3 Deleži helične strukture IDP-jev v nevezanem stanju (predzvitost) ... 22
4.1.4 Deleži helične strukture IDP-jev v vezanem stanju ... 22
4.1.5 Primerjava deležev heličnosti določenih eksperimentalno s tistimi določenimi na osnovi ak-zaporedja (AGADIR) ... 23
4.1.6 Levcinski motivi LXXLL stabilizirajo helično strukturo v nevezanem stanju… ... 24
4.1.7 Številni vezavni motivi IDP tudi stabilizirajo helično strukturo v nevezanem
stanju… ... 25
4.2 Vezanje kameloidnih protiteles ... 27
4.2.1 Izotermna titracijska kalorimetrija (ITC) ... 27
4.2.2 Analiza aminokislinskega zaporedja variabilnih zank ... 28
4.2.3 Korelacije med aminokislinskim zaporedjem in termodinamskimi prispevki… ... 29
5 Zaključek ... 33
6 Literatura ... 35
7 Priloge ... 39
Seznam uporabljenih kratic in simbolov
ak aminokislina
IDP intrinzično nestrukturiran protein (angl. »Intrinsically disordered protein«) IDR intrinzično nestrukturirana regija (angl. »Intrinsically disordered region«) NMR jedrna magnetna resonanaca
CD cirkularni dikroizem
SAXS rentgensko sipanje pri majhnih kotih (angl. »small-angle x-ray scattering«) Nb nanotelo
HCAb težkoverižno protitelo
CH konstantna domena težke verige protitelesa CL konstantna domena lahke verige protitelesa VH variabilna domena težke verige protitelesa VL variabilna domena težke verige protitelesa VHH variabilna domena težkoverižnega protitelesa Fab antigen-vezavni fragment klasičnega protitelesa
CDR hipervariabilna regija (angl. »Complementarity Determining Region«) FR ogrodje nanotelesa (angl. »framework«)
ITC izotermna titracijska kalorimetrija
ΔG° sprememba standardne Gibbsove proste energije ΔH° sprememba standardne entalpije
ΔS° sprememba standardne entropije
ΔCp° sprememba standardne toplotne kapacitete M makromolekula
L ligand
<H> povprečna normalizirana hidrofobnost
<R> povprečni normaliziran neto naboj
MRE izmerjena molarna eliptičnost povprečena na aminokislinski ostanek (angl.
»Mean Residue molar Ellipticity«) fH faktor heličnosti
[θ] eliptičnost
1
1 Uvod
1.1 Vezava proteinov
Proteini igrajo pomembno vlogo v molekularnem ustroju vsake celice. Večina celičnih procesov, kot so celična proliferacija, rast, diferenciacija, prenos signalov in apoptoza, je namreč odvisnih od vzpostavitve kompleksnih in natančno reguliranih omrežij proteinskih interakcij. Prekinitev ali deregulacija takšnih povezav je pogosto vzrok za razvoj bolezni [1].
Slika 1: Primerjava vezanja globularnih proteinov in intrinzično nestrukturiranih proteinov (IDP-jev).
Zgoraj (modro) je prikazan primer vezanja globularnega proteina na tarčo (siva), kjer pred samo vezavo pride do zvitja naključnega klobčiča v stabilno 3D strukturo (vezanje togih teles). V sredini je prikazan primer vezave protitelesa (nanotelesa, vijolična) na pripadajoč antigen (siva), kjer pride do strukturne prilagoditve variabilnih zank CDR. Spodaj je primer vezave IDP-ja (oranžno), ki se v končno obliko zvije šele ob vezavi na svojo tarčo (sivo).
2
Dolgo časa je veljalo prepričanje, da je funkcija proteina pogojena z njegovo stabilno tridimenzionalno (3D) strukturo. Osnova za razmišljanje je hipoteza, ki jo je leta 1894 predstavil Emil Fisher, ki pravi, da lahko specifičnost prepoznavanja proteinov razložimo s pomočjo specifične konformacije encimov, na katere se lahko vežejo le točno določeni substrati. Gre za t.i. »lock and key« model vezanja oziroma vezanje na osnovi ključa in ključavnice, kjer s ključavnico ponazorimo encim, s ključem pa substrat ali katerikoli drug molekulski ligand. Pogoj za takšen sistem togega vezanja je seveda, da se ključ (substrat) ustrezno prilega ključavnici (aktivnemu mestu encima). V primeru neujemanja tako ne pride do vezave (slika 1a). Vendar pa proteini niso rigidne strukture, kot bi na prvi pogled sklepali iz njihovih kristalnih struktur, temveč dinamične molekule z močno izraženo konformacijsko fleksibilnostjo. V naravi namreč najdemo mnogo primerov prepoznavanja, kjer se eden od vezavnih partnerjev strukturno prilagodi tarčnemu proteinu (slika 1b in 1c). Takšno je npr. prepoznavanje antigenov s protitelesi, kjer se fleksibilne zanke prilagodijo vezavnemu mestu tarčnega antigena. V takem primeru se ogrodje protitelesa ne spremeni, pride pa do strukturne prilagoditve zank CDR tarči (slika 1b). Ekstremen primer strukturne prilagodljivosti predstavljajo primeri IDP-jev, za katere je značilno, da celoten segment pridobi strukturo šele ob vezavi na tarčo (slika 1c) [2].
Slika 2: Vezanje sklopljeno s strukturno prilagoditvijo. Primer konformacijske selekcije (zgoraj), kjer do konformacijske spremembe proteina pride pred samo vezavo na tarčo, in primer inducirane prilagoditve (spodaj), pri kateri pride do konformacijske spremembe iz nizko-afinitetne oblike v visoko-afinitetno obliko po vezavi na tarčo.
Interakcije, pri katerih pride do spremembe strukture enega od vezavnih partnerjev, lahko obravnavamo v smislu modelov inducirane prilagoditve ali konformacijske selekcije (slika 2). Modela se med seboj razlikujeta predvsem v mehanizmu nastanka kompleksa (kinetiki), termodinamsko pa se ne razlikujeta, saj so razlike termodinamskih funkcij stanja neodvisne od poti (začetno in končno stanje sta v primeru obeh modelov enaka). V modelu inducirane prilagoditve (angl. »induced fit«) predpostavljamo, da po vezavi na tarčo pride do konformacijskih sprememb proteina iz nizko-afinitetne oblike v visoko- afinitetno obliko. Pri takšnih interakcijah torej opazimo razlike med strukturama prostega
3
in vezanega proteina. V modelu inducirane prilagoditve (angl. »conformational selection«) pa predpostavimo konformacijsko spremembo že pred samo vezavo na tarčo.
Model razložimo s pomočjo ravnotežja med obliko z nizko afiniteto do tarče (konformacija z omejeno sposobnostjo vezave) in obliko z visoko afiniteto (konformacija ki se selektivno veže na tarčo) [3].
Intermolekularne sile vključene v interakcije protein-protein
Osnova molekulskega prepoznavanja predstavlja skupek različnih nekovalentnih interakcij med vezavnimi partnerji, ki morajo (globalno gledano) prevladati nad tistimi, ki jih posamezna molekula tvori s topilom v svoji nevezani obliki. Nekovalentne interakcije lahko v osnovi razdelimo na elektrostatske in hidrofobne. Med elektrostatske spadajo: 1) van der Waalsove interakcije; 2) vodikove vezi (privlačna interakcija med donorjem in akceptorjem vodika); 3) Coulumbove interakcije (med nasprotno nabitimi stranskimi skupinami aminokislin) in 4) druge manj pogoste interakcije (npr. π-π interakcije med aromatskimi aminokislinskimi ostanki). Poleg vzpostavitve specifičnih nekovalentnih interakcij nastanek kompleksa spremlja tudi zmanjšanje konformacijskih in translacijskih prostostnih stopenj molekul, ki interagirajo, ter spremembe v solvataciji proteinov. Ob vezavi namreč pride do zakritja hidrofobnih površin, molekulam vode, ki so pred tem obdajale hidrofobne ostanke, pa se posledično povečajo prostostne stopnje.
Hidrofobni efekt kot tak predstavlja eno glavnih gonilnih sil tako zvitja proteinov kot tudi medproteinskih interakcij [4]. Poleg zgoraj naštetih termodinamsko pomembnih efektov interakcij med proteini velja dodati še morebitne konformacijske spremembe vezavnih partnerjev ob vezanju (konformacijski entropijski prispevek) [5].
1.2 Intrinzično nestrukturirani proteini
Intrinzično nestrukturirani proteini oziroma na kratko IDP-ji (angl. »Intrinsically Disordered Proteins«) so, kot samo ime pojasnjuje, proteini brez prave, enoznačno definirane strukture. Kljub temu da niso (povsem) zviti in da se njihova prostorska razporeditev dinamično spreminja, ne gre za denaturirane proteine, pač pa prav ta nestrukturiranost predstavlja njihovo nativno, funkcionalno stanje. S svojim obstojem IDP-ji nasprotujejo klasični paradigmi, ki povezuje strukturo proteina z njegovo funkcijo (angl. »structure-function paradigm«) [6, 7].
4
Slika 3: Prikaz proste energije (G) globularnih proteinov (levo) s strukturo z izrazitim energijskim minimumom in IDP-jev (desno), za katere je značilna razgibana površina brez izrazite termodinamsko ugodne konformacije.
Dolgo časa je bil v veljavi pogled na funkcionalne proteine kot na rigidne (ali delno rigidne) molekule oz. njihove domene z unikatno in stabilno 3D strukturo (slika 3, levo).
Eksperimentalno določene strukture (predvsem s pomočjo rentgenske kristalografije) so prikazovale proteine kot aperiodične kristale, pri katerih so tako atomi kot tudi torzijski koti proteinskega skeleta praktično fiksirani in prikazujejo le majhno nihanje okoli svoje ravnovesne lege. Čeprav takšen pogled na povezavo med strukturo in funkcijo velja za veliko število funkcionalnih proteinov, pri katerih je aminokislinsko zaporedje povezano z eno samo stabilno strukturo in posledično biološko funkcijo, pa je bilo odkritih mnogo funkcionalnih proteinov (IDP-jev) ali proteinskih regij (IDR, angl. »Intrinsically Disordered Region«), ki pri fizioloških pogojih ne posedujejo dobro definirane 3D strukture (slika 3, desno). V primerjavi z urejenimi proteini, kot so npr. globularni proteini, pri IDP-jih ne opazimo enotne, dobro definirane ravnotežne strukture, ampak le- ti obstajajo kot visoko dinamičen, heterogen ansambel konformacij s podobnimi energijami [8]. Kot pomembno lastnost nestrukturiranih proteinov v primerjavi z globularnimi je potrebno omeniti tudi razlike v aminokislinski sestavi. V IDP-jih namreč najdemo več polarnih in nabitih ak-ostankov, opazen pa je primanjkljaj hidrofobnih ostankov. To pomeni, da je, generalno gledano, za IDP-je značilna nižja povprečna hidrofobnost in pa višji neto naboj, ki skupaj očitno predstavljata pogoj za nestrukturiranost [9].
Kljub pomankanju urejene strukture IDP-ji opravljajo številne pomembne biološke funkcije, komplementarne funkcionalnemu repertoarju urejenih proteinov. Najdemo jih v različnih organizmih (najbolj številčni so pri evkariontih), kjer sestavljajo raznoliko in zelo pomembno podmnožico proteoma. Koncentracije IDP-jev v celici so natančno regulirane, mutacije in druge spremembe pa lahko vodijo v razvoj različnih bolezni.
Zaradi svojih lastnosti, kot so na primer: prisotnost prepoznavnih elementov, ki se zvijejo ob vezavi na tarčo; delna fleksibilnost, ki omogoča interakcijo z več različnimi vezavnimi partnerji; enostavna regulacija s post-translacijskimi modifikacijami in visoka specifičnost vezave brez tvorbe močnih vezi; IDP-ji igrajo pomembno vlogo v regulaciji
5
signalnih poti in kritičnih celičnih procesov [8, 10]. Poleg tega so v celicah relativno številčni, in zato predstavljajo pomembno področje raziskav. Zaradi njihove inherentne nestrukturiranosti jih sicer ne moremo preučevati s klasičnimi strukturnimi metodami kot sta rentgenska kristalografija in cryo-EM, se pa zato uporabljajo druge (spektroskopske) eksperimentalne metode, ki so bolj primerne. Mednje spadajo jedrska magnetna resonančna spektroskopija (NMR), spektroskopija cirkularnega dikroizma (CD) in sipanje rentgenskih žarkov pod majhnimi koti (SAXS).
IDP-ji v interakcijah protein-protein
Pomembna lastnost intrinzično nestrukturiranih proteinov je sposobnost povezovanja s širokim naborom vezavnih partnerjev, ki vključuje tako klasične proteine s stabilno 3D strukturo kot tudi druge IDP-je. V interakcije so lahko vključeni kratki motivi ali pa večje nestrukturirane domene, pri katerih ob vezavi na tarčo pride do t.i. prehoda »disorder-to- order«, oziroma prehoda iz neurejene v urejeno strukturo. Prehod IDP-ja iz proste v vezano obliko (zvijanje proteina sklopljeno z vezanjem) spremlja negativen entropijski prispevek, ki je posledica konformacijskih sprememb. Pomembna prednost vezanja IDP- jev je ta, da je vezavna površina (glede na velikost samega IDP-ja) veliko večja kot v primeru dveh togih, globularnih proteinov, kar kompenzira omenjen negativen entropijski prispevek na račun konformacijskih sprememb. Ker takšen proces poteka vsaj v dveh korakih (t.j. korak zvitja in korak vezave), so vezavni mehanizmi lahko zelo kompleksni [11]. Pri tem se velja vprašati, kako je mogoče, da se IDP-ji kljub odsotnosti urejene strukture v nevezanem stanju tako uspešno povezujejo z drugimi proteini? Iz njihove definicije sicer izhaja, da so v svoji prosti obliki neurejeni, vendar pa to nujno ne nakazuje na popolno odsotnost strukturiranosti. Med različnimi tipi interakcij med IDP-ji in globularnimi proteini prevladuje razred IDP-jev, ki se ob vezavi na tarčo zvijejo v α- vijačnico (ti so tudi najbolj preučeni) [12]. Predvsem študije na osnovi NMR so pokazale, da ti IDP-ji pogosto posedujejo znaten delež »prehodne« helične strukture. Gre za t.i.
predzvitost, pojem, ki opisuje prisotnost sekundarnih strukturnih elementov (v tem primeru α-vijačnice) v nevezani obliki IDP-jev. Izkaže se tudi, da te predzvite strukture lahko sovpadajo s strukturnimi elementi kompleksa IDP-tarča in na ta način igrajo pomembno vlogo v procesu vezave [13, 14].
1.3 Nanotelesa
Nanotelo (angl. »nanobody« – Nb) je najmanjši funkcionalen antigen-vezavni element, ki izvira iz težkoverižnega protitelesa (angl. »heavy-chain antibody« – HCAb). HCAb-je najdemo v krvnem serumu živali iz družine kamelidov (lat. Camelidae), podobno zgradbo protiteles pa opazimo tudi pri morskih psih. Za razliko od klasičnega protitelesa (npr. imunoglobulin-γ, slika 4, levo), ki ga sestavljata dve identični težki in dve identični lahki verigi, težkoverižna protitelesa (slika 4, desno) ne vsebujejo lahke verige in prve
6
konstantne domene (CH1). Na N-koncu težke verige takšnega homodimernega proteina najdemo posebno variabilno domeno (VHH) oz. nanotelo, ki služi povezovanju s svojim pripadajočim antigenom. Fragment VHH tako predstavlja strukturni in funkcionalni ekvivalent antigen-vezavnemu fragmentu (Fab) klasičnega protitelesa [15].
Slika 4: Shematski prikaz zgradbe klasičnega protitelesa IgG (levo) in težkoverižnega protitelesa oziroma HCAb (desno). VL – variabilna domena lahke verige; CL – konstantna domena lahke verige; VH – variabilna domena težke verige; CH1-3 – konstantne domene težke verige; VHH – variabilna antigen- vezavna domena težke verige HCAb.
Strukturne značilnosti fragmenta VHH
Sekvenčna raznolikost znotraj variabilnih domen izhaja iz treh hipervariabilnih regij oz.
zank CDR (angl. »Complementarity Determining Region«), ki so obkrožene z bolj ohranjenim ogrodjem. Osnovo zvitja predstavlja 9 β-trakov, združenih v dve β-ploskvi (4+5), ki ju povezujejo zanke in ena disulfidna vez (slika 5). Skupek treh zank na N-koncu domene tvori neprekinjeno površino, ki je komplementarna površini epitopa na katerega se nanotelo veže. VHH se od variabilnih domen težke verige (VH) klasičnih protiteles razlikujejo v dveh pogledih: 1) hidrofobne aminokisline, ki so odgovorne za interakcijo z variabilno lahko domeno (VL), nadomestijo manjše in/ali polarne aminokisline, ter 2) prepoznavanje antigena v primeru kamelidne VHH poteka preko treh zank CDR (ki tvorijo vezavni paratop) namesto šestih - odsotnost VL. Zanke so zato v tem primeru daljše, da lahko tvorijo ustrezno veliko antigen-interakcijsko površino (600-800 Å2) [15].
Pri tem velja omeniti predvsem razlike v dolžini in orientaciji zanke CDR3. Ta zanka namreč ustreza edinstveni regiji protitelesa, ki jo kodira na novo ustvarjen genetski element (tekom zorenja B-celic). Med V(D)J-rekombinacijo pride do fuzije centralnega D-genetskega elementa s krajnima V in J. Dodajanje in/ali odstranjevanje posameznih nukleotidov na stičiščih teh regij pa še dodatno poveča genetsko raznolikost. Zanka CDR3 na ta način prispeva največji delež k raznolikosti in specifičnosti protiteles (zanki
7
CDR1 in CDR2 sta kodirani z omejenim številom različnih V-elementov). Poleg tega je za zanko CDR3 kamelidne VHH značilna tudi širša porazdelitev dolžin (3-28 aminokislinskih ostankov) v primerjavi s človeško VH domeno (8-15 aminokislinskih ostankov). Daljša zanka poveča potencialno interakcijsko površino s tarčnim antigenom, in na ta način vsaj delno kompenzira za manjkajočo variabilno domeno lahke verige.
Pogosto se daljše oblike zanke CDR3 »prepognejo« na stran domene VHH, kjer je v primeru klasičnih protiteles hidrofobna interakcijska površina, preko katere se povežeta VH in VL domeni [16].
Slika 5: a) 3D-struktura nanotelesa določena s pomočjo rentgenske kristalografije (PDB: 6OS1) in b) shematski prikaz zvitja nanotelesa. Z barvami so označene tri hipervariabilne regije (zanke CDR), ki tvorijo površino komplementarno površini epitopa kamor se nanotelo veže. S sivo barvo je prikazano ogrodje (angl.
»framework«; FR1-FR4). Povzeto po [17].
1.4 Spektropolarimetrija (CD)
Spektropolarimetrija je spektroskopska metoda, ki temelji na dejstvu, da nekatere molekule interagirajo drugače z levo- oz. desnosučno polarizirano svetlobo. Optično aktivne (kiralne) molekule, kot so na primer proteini, pri obsevanju z linearno polarizirano svetlobo povzročijo neenakomerno absorpcijo levo- in desno-krožne polarizirane svetlobe. Razlika v absorbanci je razlog za nastanek pojava cirkularnega dikroizma (CD) [18, 19].
Proteini in peptidi vsebujejo veliko število funkcionalnih skupin z značilnimi absorpcijskimi trakovi v vidnem in UV delu svetlobnega spektra. Takšnim skupinam pravimo kromoforji, med najbolj številčne v proteinih pa prav gotova spada peptidna vez, ki povezuje aminokislinske ostanke med seboj. Za amide sta značilni dve nizko energijski elektronski tranziciji: tranzicija n-π* pri približno 220 nm in tranzicija π-π* okoli 190 nm, ki prevladujeta tako v spektru CD, kot tudi absorpcijskih spektrih UV območja. Poleg
8
tega imajo značilne absorpcijske trakove v bližnjem UV delu med drugim tudi aromatski ostanki (Phe, Tyr, Trp) in disulfidne vezi. Karakteristični absorpcijski trakovi pa so značilni tudi za različne sekundarne strukture (slika 6), ki jih zavzamejo proteini ob zvitju (α-vijačnica, β-ploskev, zavoji itd.) Najmočnejši in najbolj izrazit med njimi je spekter α- vijačnice z dvema značilnima negativnima trakovoma pri 222 in 208 nm ter enim pozitivnim pri približno 190 nm. Z izjemo peptidov, ki vsebujejo veliko število aromatskih ostankov, je spekter CD praktično neodvisen od narave stranskih skupin aminokislin, ki sestavljajo peptid. Za primerjavo, pri peptidih ki tvorijo β-ploskev, opazimo manj izrazit maksimum pri 195 nm in dva minimuma pri 217 in 180 nm. Za razliko od urejenih proteinov/peptidov pa je za nestrukturirane primere značilen absorpcijski minimum pri 200 nm, prisotnost negativnega traku pri približno 220 nm pa kaže na delno strukturiranost v raztopini, ki je značilna za IDP-je [20].
Slika 6: Spektri CD značilni za različne tipe sekundarne strukture: modra – α-vijačnica; rdeča – β- ploskev; zelena – naključni klobčič (angl. »random coil«).
1.5 Izotermna titracijska kalorimetrija (ITC)
Izotermna titracijska kalorimetrija je edina eksperimentalna tehnika, ki nam omogoča direktno merjenje in vrednotenje vezavnih energij biokemijskih reakcij in molekularnih interakcij. Mednje spadajo interakcije protein-protein, protein-ligand, protein-DNA in druge. Z uporabo ITC lahko v takšnih primerih natančno določimo spremembe standardne Gibbsove proste energije (ΔG°), standardne entalpije (ΔH°), standardne entropije (ΔS°) in standardne toplotne kapacitete (ΔCp°), povezane s procesom vezanja [21].
9
Zasnova inštrumenta: Dve identični celici (vzorčna in referenčna) sta zaprti v adiabatnem plašču, kot je prikazano na shemi (slika 7a). Referenčna celica služi samo kot temperaturna referenca. Kontrolna povratna zanka preko Peltier-jevega polprevodnika, ki se nahaja med obema celicama, zaznava razliko v temperaturi med celicama in skrbi za to, da je ta razlika ves čas čim bližje ničli. Prav ta povratni signal je tudi signal, ki ga merimo – dq/dt (μcal/sec). Za izvedbo poskusa napolnimo siringo (brizgo) z enim od reaktantov, z drugim pa napolnimo vzorčno celico. Med samim potekom eksperimenta se titrant dodaja v raztopino vzorca preko siringe, ki poskrbi tudi za hitro mešanje vzorca [22].
Slika 7: a) Shema kalorimetra ITC s pripadajočimi elementi in b) primer končnega rezultata eksperimenta ITC (zgoraj: integriran termogram, spodaj: graf entalpije vezanja s prikazanimi podatki vezanja: sprememba entalpije - ΔH, stehiometrija reakcije - n).
Princip delovanja: Inštrument ITC je kalorimeter, ki deluje po principu dinamične kompenzacije moči, kar pomeni, da meri količino moči (μcal/sec), ki je potrebna za ohranjanje konstantne temperaturne razlike med vzorcem in referenčno celico. Sprva sistem celici z vzorcem dovaja neko konstantno količino moči, s čimer določi bazno linijo. Nato vsak vbrizg raztopine iz siringe (brizge) v celico z vzorcem sproži reakcijo – pride do vezanja. Glede na afiniteto vezave in koncentracije reaktantov (makromolekula – M in ligand – L) pride do tvorbe določene količine kompleksa (ML). Ta proces spremlja sproščanje (eksotermna reakcija) oziroma absorpcija (endotermna reakcija) toplote, ki privede do temperaturne razlike med obema celicama. Na spremembo se sistem odzove s prilagajanjem toplotne moči in s tem kompenzira temperaturno neravnovesje (na grafu opazimo vrh, slika 7b). Integracija površine pod takim vrhom ob upoštevanju bazne linije pa nam da količino toplote, ki je povezana z vsakim posameznim vbrizgom. Z nasičenjem reaktanta v celici pride do pojemanja signala, ki naposled izgine v ozadju (vzrok so nespecifični pojavi, kot je na primer razredčenje vzorca z ligandom) [22].
11
2 Namen dela
Cilj magistrskega dela je s strukturnega in termodinamskega vidika preučiti primere vezanja oziroma prepoznavanja proteinov, pri katerih pride do strukturne prilagoditve enega od vezavnih partnerjev. V takšnih primerih opazimo razliko med strukturama prostega in vezanega proteina, proces strukturne prilagoditve pa spremljajo tudi določeni termodinamski prispevki. Pri delu smo se osredotočili na dve skupini proteinskih interakcij: 1) interakcije med intrinzično nestrukturiranimi proteini, ki se ob vezavi na globularno tarčo zvijejo v α-vijačnico, in 2) interakcije med nanotelesi (fragmenti kameloidnih protiteles) in njihovimi tarčami.
V prvem delu naloge začnemo s strukturno analizo interakcij med intrinzično nestrukturiranimi proteini in njihovimi tarčami. Cilj raziskave je določiti kolikšna je zastopanost helične strukture pri IDP-jih v nevezanem stanju in kako se le-ta spremeni ob vezavi na tarčo. Zanima nas torej povezava med aminokislinskim zaporodjem in strukturo IDP-ja (v nevezanem in vezanem stanju). V ta namen smo pripravili bazo podatkov IDP- jev, pri katerih je eksperimentalno okarakterizirano nevezano stanje (spektri CD) in vezano stanje (strukture IDP-tarča pridobljene z rentgensko kristalografijo ali NMR). S pomočjo baze podatkov smo določili deleže helične strukture za 65 IDP-jev za vezano in nevezano stanje. Pridobljeni podatki omogočajo bioinformatsko analizo specifičnih interakcij, prekrivanja heličnih regij v obeh stanjih in vpliva aminokislinskega zaporedja na zvitje.
Hipoteze:
- S pomočjo literaturnih podatkov lahko sestavimo reprezentativen vzorec α- heličnih IDP-jev.
- Delež α-vijačnice v nevezanem stanju je znaten, IDP-ji so predzviti.
- Delež α-vijačnice se ob vezavi na tarčo poveča.
- Levcinski motivi imajo pomembno vlogo pri stabilizaciji α-vijačnice v nevezanem stanju.
V drugem delu naloge nadaljujemo z analizo interakcij med fragmenti kameljih protiteles in njihovimi tarčami. Osredotočili smo se na termodinamsko analizo vezanja različnih nanoteles na toksina HigB2 in MazF iz sistemov toksin-antitoksin. Tukaj pa nas zanima predvsem povezava med termodinamiko vezanja in sekvenco zanke CDR, saj strukture prostih proteinov in njihovih kompleksov še niso znane. Cilj je ugotoviti, ali lahko vrednosti termodinamskih prispevkov za vezavo antigen-protitelo pojasnimo s sekvenčnimi lastnostmi CDR zank (npr. dolžino, hidrofobnostjo ipd.).
12
Hipoteze:
- Z metodo ITC lahko okarakteriziramo termodinamske prispevke vezave fragmentov kameljih protiteles na antigene HigB2 in MazF.
- Dolžina variabilne regije CDR3 nanotelesa vpliva na afiniteto vezave.
- Hidrofobnost variabilne regije CDR3 vpliva na afiniteto vezave.
- Razlike v entalpiji določajo razlike v afiniteti.
13
3 Materiali in metode
3.1 Bioinformatski del
3.1.1 Podatkovna baza α-heličnih peptidov
Podatkovni set skupno vključuje 65 primerov α-heličnih IDP-jev (priloga 1). Za 53 izmed njih smo eksperimentalne podatke (spekter CD) pridobili v literaturi, spektri CD za preostalih 12 pa so bili posneti v našem laboratoriju. Bazo sestavljajo izključno peptidi s signifikantno težnjo po tvorjenju α-vijačnice ob vezavi na tarčo (viri za vsak posamezen element podatkovne zbirke so zbrani v prilogi 3). Razpon dolžin peptidov je od 12 do 76 ak-ostankov, povprečje znaša 30 ak-ostankov. Daljši peptidi in primeri celotnih peptidov so bili iz baze izločeni. Poleg deleža α-vijačnice v prosti obliki, podatkovno bazo sestavljajo še naslednji podatki oziroma parametri: i) identifikacijska koda UNIPROT; ii) segment znotraj zaporedja; iii) dolžina segmenta; iv) pogoji, pri katerih je bil posnet spekter CD (temperatura, pH in ionska moč pufra); v) napoved AGADIR; vi) potencialni vezavni partnerji (tarče); ter vii) delež α-vijačnice v vezanem stanju.
Meritve, opravljene v našem laboratoriju
Spektri CD peptidov: ccda37-62, FCP1YG(944-958), HigA23-22, MLL2846-2859, PaaA2_116-34, PaaA2_235-63, phd4W56-73, phd5W61-73, RelA_NLS293-316, 2G, 4G in 6G so bili posneti na termostatiranem inštrumentu CD J–5000 (Jasco), ki omogoča sočasno merjenje šestih vzorcev. Pred vsako meritvijo je bil signal umerjen glede na referenčno raztopino kafre (0,06%). V slepem eksperimentu sta bila pomerjena (in naknadno odšteta) tudi prispevka pufra in kivete. Uporabljene so bile kvarčne kivete z dolžino optične poti 1 mm.
3.1.2 Analiza na osnovi aminokislinskega zaporedja
Sekvenčna analiza je bila opravljena s pomočjo programske opreme Anaconda, ki deluje na osnovi Pythona. Poleg zastopanosti posameznih aminokislinskih ostankov v podatkovnem setu sta bila za vsak peptid v bazi, po zgledu »Uversky plot-a« (graf hidrofobnosti v odvisnosti od neto naboja), izračunani tudi povprečna normalizirana hidrofobnost po lestvici »Kyte-Doolittle« (tabela 1) in povprečen neto naboj (oboje računano glede na posamezen aminokislinski ostanek). Lestvica hidrofobnosti loči aminokisline glede na njihov hidrofobni karakter. Vrednost 1, ki pripada izolevcinu, označuje najbolj hidrofobno ak, medtem ko vrednost 0 (arginin) označuje najmanj hidrofobno ak. Neto naboj za vsak posamezen peptid je izračunan pri pH 7, glede na vsebnost nabitih ak-ostankov (lizin, arginin, aspartat in glutamat). Na grafu povprečne normalizirane hidrofobnosti v odvisnosti od povprečnega neto naboja je meja, ki ločuje neurejeno strukturo od urejene, definirana z enačbo:
14
< 𝐻 > = < 𝑅 > +1.151
2.785 ;
kjer je <H> povprečna normalizirana hidrofobnost in <R> povprečni neto naboj. Enačba kot taka podaja oceno mejne vrednosti normalizirane hidrofobnosti, pod katero bo neka polipeptdina veriga z določenim neto nabojem neurejena [23].
Tabela 1: Lestvica hidrofobnosti po Kyte-Doolittle-u
Aminokislina Enočrkovna oznaka
Hidrofobnost po Kyte-Doolittle
Normalizirana hidrofobnost
izolevcin I 4,50 1,000
valin V 4,20 0,967
levcin L 3,80 0,922
fenilalanin F 2,80 0,811
cistein C 2,50 0,778
metionin M 1,90 0,711
alanin A 1,80 0,700
glicin G -0,40 0,456
treonin T -0,70 0,422
serin S -0,80 0,411
triptofan W -0,90 0,400
tirozin Y -1,30 0,356
prolin P -1,60 0,322
histidin H -3,20 0,144
glutamat E -3,50 0,111
glutamin Q -3,50 0,111
aspartat D -3,50 0,111
asparagin N -3,50 0,111
lizin K -3,90 0,067
arginin R -4,50 0,000
Dodatno, sekvenčna karakterizacija omogoča tudi ovrednotenje interakcij med i, i+4 (tudi i, i+3) aminokislinskimi ostanki v strukturi α-vijačnice, ki pomembno vplivajo na stabilnost same strukture. Primere stabilizirajočih interakcij med različnimi skupinami ak-ostankov smo pridobili iz [24] in [25]. Osredotočili smo se na interakcije med: 1) nasprotno nabitimi ak-ostanki, 2) nabitim in aromatskim ak-ostankom, 3) hidrofobnimi ak-ostanki, 4) polarnimi ak-ostanki, ter 5) aromatskimi in hidrofobnimi ak-ostanki.
15
3.1.3 Heličnost v nevezanem in vezanem stanju
Delež α-vijačnice posameznega peptida v prosti (nevezani) obliki je bil določen iz intenzitete signala CD pri 222 nm. Vse surove podatke (grafi spektrov iz literature in naše lastne meritve) smo pretvorili v standardne enote – MRE (angl. »Mean Residue molar Ellipticity«) z enoto [deg/cm2/dmol-1]. Za izračun vsebnosti α-vijačnice smo uporabili naslednje enačbe:
fH = [θ]OBS – [θ]C [θ]H – [θ]C ; [θ]C = 2220 – 53T;
[θ]H = (-44000 + 250T) (1-3/Nr);
kjer je fH delež α-vijačnice (od 0 do 1), [θ]OBS je odčitan signal pri 222 nm pretvorjen v
»MRE«, [θ]C je teoretični signal, ki bi ga imel peptid s 100-odstotno naključno strukturo (angl. »random coil«), [θ]H je teoretični signal, ki bi ga imel peptid s 100-odstotno α- vijačno strukturo, T je eksperimentalna temperatura v ºC, Nr pa je število aminokislinskih ostankov v peptidu [24].
AGADIR
Napovedi deleža α-vijačnice v nevezani obliki smo opravili s pomočjo spletnega orodja AGADIR. Gre za algoritem na osnovi »helix-coil« teorije, ki s pomočjo vhodnih podatkov (ak zaporedje, pH, temperatura in ionska moč) poda teoretičen izračun deleža α-vijačnice. Poleg tega pa omogoča tudi približno napoved same lokacije vijačnice znotraj analiziranega segmenta peptida/proteina [26].
Potencialne interakcijske partnerje in delež heličnosti IDP-jev v vezani obliki smo poiskali v bazi PDB s pomočjo aminokislinskega zaporedja (funkcija »Advanced Sequence Search«). Surove podatke v obliki formata PDB smo analizirali s pomočjo spletnega orodja STRIDE [27], ki na podlagi torzijskih kotov vsakega posameznega aminokislinskega ostanka predvidi, ali je le-ta del sekundarne strukture (npr. α-vijačnice), naključnega klobčiča, zavoja itd.
3.1.4 Vezavni motivi
Iz literature smo zbrali primere 20 tipičnih IDP vezavnih motivov (priloga 2). Za vsakega izmed motivov smo določili delež vijačne strukture v nevezanem stanju znotraj gostiteljskega zaporedja (ponovitev SETSTTSSS na začetku in koncu motiva).
Gostiteljsko zaporedje ima enako težnjo po heličnosti kot IDP-ji v naši podatkovni zbirki.
V odsotnosti motiva ni urejeno in ne kaže težnje po tvorbi α-vijačnice.
16
3.2 Eksperimentalni del
3.2.1 Priprava vzorcev
Pufri za ITC
Za pripravo vseh vzorcev je bil uporabljen 20 mM fosfatni pufer (pH 6,8) z naslednjo sestavo:
• 10 mM Na2HPO4
• 10 mM NaH2PO4 x 2H2O
• 150 mM NaCl
• 1 mM EDTA Biomolekule
Toksin HigB2 in pripadajoči fragmenti kameloidnih protiteles (nanoteles) so bili pripravljeni v laboratoriju prof. Lorisa v Belgiji.
Dializa in merjenje koncentracije
Vzorce toksina in nanoteles smo odmrznili in dializirali proti 20 mM fosfatnem pufru s pomočjo dializnih kaset (Thermofischer Scientific Slide-A-Lyzer). Vzorce smo dializirali dvakrat po 2 uri pri sobni temperaturi in vmes zamenjali pufer s svežim. V zadnjem (tretjem) ciklu smo vzorce z vnovič zamenjanim pufrom dializirali preko noči v hladilniku.
Pred merjenjem koncentracije smo vzorce centrifugirali 15 min pri 15000 obratih/min.
Za določanje koncentracije toksina HigB2 in posameznih nanoteles smo uporabili UV- VIS spektrofotometer (Varian – Cary BIO 100). Meritve smo izvedli pri 280 nm v ustreznih kivetah, dolžine optične poti od 1 mm do 10 mm (odvisno od koncentracije vzorca). Izračun koncentracij je temeljil na osnovi ekstinkcijskih koeficientov, določenih z uporabo orodja ProtParam (Expasy, dostopno na: https://web.expasy.org/protparam/), iz aminokislinskih zaporedij posameznih vzorcev.
3.2.2 ITC
Izvedba poskusov
Koncentracija toksina v celici je bila 4 μM, koncentracija nanotelesa v siringi (injekciji) pa je bila odvisna od želene stehiometrije reakcije (37,2 μM, 46,5 μM oz. 74,4 μM). V primeru obratnih titracij (Nb4 in Nb9) je bila koncentracija nanotelesa v celici 2 μM, koncentracija toksina v injekciji pa 22 μM. Pred vsakim eksperimentom smo vzorce razplinjevali pri znižanem tlaku, saj ima prisotnost plinskih mehurčkov negativen vpliv
17
na izvedbo meritve. Meritve smo izvedli pri 25 in 35 °C na izotermnem titracijskem kalorimetru (MicroCal VP-ITC).
Obdelava meritev Meritve za sistem HigB2
Za analizo podatkov meritev ITC smo uporabili orodje NITPIC [28], ki omogoča integriranje surovih termogramov. Izbrali smo serijsko integracijo pri dveh različnih temperaturah (25 in 35 °C), kar v nadaljevanju omogoča globalno temperaturno analizo v programu SEDPHAT [29] (modelni opis krivulj) in posledično izračun termodinamskih parametrov vezave (ΔH, ΔG in ΔCp). Za končen izris krivulj smo uporabili program GUSSI [30].
Meritve za sistem MazF
Meritve vezanja nanoteles proti MazF (skupno 13) so bile opravljene predhodno, in sicer pri treh različnih temperaturah: 18, 25 in 32 °C . Način obdelave meritev je bil enak kot v primeru sistema HigB2.
Asignacija regij CDR
Regije CDR nanoteles obeh sistemov (HigB2 in MazF) smo določili na osnovi sheme številčenja IMGT [31] in uporabe računalniškega programa ANARCI (»Antigen receptor Numbering And Receptor ClassificatIon«)[32].
19
4 Rezultati in razprava
4.1 Vezanje intrinzično nestrukturiranih proteinov
4.1.1 Zbirka podatkov α-heličnih IDP-jev
Za namen preučevanja deleža α-helične strukture v IDP-jih smo sestavili podatkovno zbirko, ki vključuje eksperimentalne podatke iz literature in naše lastne meritve (priloga 1). Bazo podatkov sestavljajo izključno IDP-ji ali segmenti le-teh, ki ob vezavi na svojo tarčo (partnerski protein) tvorijo α-vijačnico. Primere celotnih proteinov in zelo dolge segmente le-teh smo iz baze izločili. Za vsak primer posebej smo delež vijačne strukture v nevezanem stanju določili s pomočjo spektra CD (glej Metode). Na ta način smo skupno analizirali 65 primerov, od tega 53 IDP-jev iz literature in 12 IDP-jev, katerih spektri CD so bili posneti v našem laboratoriju. Povprečna dolžina peptidov v zbirki znaša 30 aminokislinskih ostankov, spektri so bili v veliki večini primerov posneti pri sobni temperaturi (20 oz. 25°C) in fizioloških pogojih (pH 7-7,5, ionska moč 0,1), medtem ko je bila temperatura snemanja spektra za 10 primerov IDP-jev iz literature 4-5°C.
Dodatno smo iz baze BMRB (»Biological Magnetic Resonance Data Bank«) pridobili še NMR podatke za 25 primerov IDP-jev iz podatkovne zbirke. Meritev kemijskih premikov (za razliko od spektra CD) namreč omogoča oceno heličnosti za vsak posamezen aminokislinski ostanek. Na ta način smo še dodatno potrdili helično naravo peptidov v naši zbirki.
Nazadnje smo za vsak IDP v zbirki poiskali še njegovo strukturo v vezanem stanju (IDP- tarča) v bazi PDB. Za IDP-je v vezanem stanju smo prav tako določili delež α-vijačnice in sicer tako, da smo število ostankov, ki zavzemajo konformacijo α-vijačnice (določeno z algoritmom STRIDE), delili s številom vseh ostankov (v vezanem stanju).
Podatkovna zbirka je predstavljena v tabeli 6 (priloga 1). V prvem stolpcu je ime IDP-ja z referenco (označeno s številkami, pripadajoč seznam strokovnih člankov iz katerih so bili pridobljeni CD spektri je naveden v prilogi 3). V drugem stolpcu je navedena identifikacijska številka UNIPROT posameznega IDP-ja, tej sledita segment na katerega se nanaša meritev in dolžina samega peptida. V stolpcu 5 so navedeni pogoji pri katerih je bil posnet spekter CD v obliki temperatura/pH/ionska moč. V šestem stolpcu so navedene eksperimentalne vrednosti heličnosti, določene na osnovi spektra CD. V sedmem stolpcu sledi napoved AGADIR (teoretični izračun) za nevezano stanje. Temu sledita ime tarče na katero se veže IDP (vezavni partner) in njegova številka UNIPROT.
V zadnjem stolpcu so navedene heličnosti peptidov v vezanem stanju.
20
4.1.2 Sekvenčna karakterizacija zbirke α-heličnih motivov IDP
Preden smo se lotili analize deležev α-helične strukture v nevezanem stanju, smo pripravili preprosto analizo sekvenc IDP-jev v naši podatkovni zbirki. Analiza zaporedij α-heličnih motivov iz zbirke na osnovi naboja in hidrofobnosti pokaže, da je večina le- teh zbrana ob meji (slika 8A, črna premica), ki ločuje globularne proteine z dobro definirano strukturo od nestrukturiranih. Za globularne proteine, ki jih najdemo na desni strani ločnice, je značilna višja hidrofobnost aminokislinskih ostankov in nekoliko nižji neto naboj. IDP-je, za katere sta značilna nižja vrednost hidrofobnosti in višji neto naboj, najdemo na levi strani premice. Povprečna normalizirana hidrofobnost po lestvici »Kyte- Doolittle« za zbirko je 0,43, povprečni neto naboj pa 0,11. Večina IDP-jev (približno 3/4) ima negativen neto naboj, na splošno pa opazimo, da se naš set IDP-jev nekoliko razlikuje od običajnih IDP-jev, saj imajo ti po navadi višji neto naboj in so manj hidrofobni.
Slika 8: Karakteristike aminokislinskega zaporedja α-vijačnih prepoznavnih elementov. A - Graf hidrofobnosti v odvisnosti od neto naboja kaže, da je večina IDP-jev iz zbirke zbrana okoli premice, ki ločuje globularne proteine od intrinzično nestrukturiranih. B - Aminokislinska sestava IDP-jev iz zbirke normalizirana glede na zastopanost ak-ostankov v globularnih proteinih. Pozitivne vrednosti kažejo na večjo pojavnost določenega ak-ostanka glede na globularne proteine, negativne vrednosti pa kažejo na primanjkljaj.
21
Za bolj podroben vpogled v sekvenčne lastnosti IDP-jev iz naše zbirke smo analizirali deleže aminokislinskih ostankov in jih primerjali z deleži, ki jih opazimo v globularnih proteinih. Tovrstna analiza pokaže, da ti IDP-ji, v primerjavi z globularnimi proteini, vsebujejo večji delež nabitih aminokislinskih ostankov (D, R, E in K), dva primera polarnih ostankov (Q, N) in dva hidrofobna ostanka (M, L). Ob tem pa vsebujejo manjši delež nekaterih hidrofobnih in aromatskih aminokislinskih ostankov (slika 8B). Takšna zastopanost je sicer v skladu z običajno kompozicijo IDP-jev, vendar pa je pri tem potrebno omeniti pomembne razlike med profili α-vijačnih motivov in IDP-jev na splošno (slika 9). Na primer, α-vijačni IDP-ji so močno osiromašeni s P, medtem ko je to ak- ostanek, ki ga najpogosteje najdemo v ostalih IDP-jih [33]. Poleg tega vidimo tudi, da je za vijačne motive iz zbirke značilna večja zastopanost W, L, M in I, ter tudi nabitih ostankov R in D. Razlike, ki jih opazimo, lahko razložimo s pomočjo dveh procesov:
zvitja v strukturo vijačnice in nastanka protein-IDP interakcij. Prolin, aminokislinski ostanek z majhno težnjo po tvorjenju α-vijačnice, je v zbirki motivov osiromašen, kar ugodno prispeva k nastanku vijačnice ob vezavi na tarčni protein. Po drugi strani prisotnost hidrofobnih in aromatskih ak-ostankov (I, L, M, W) verjetno igra pomembno vlogo pri tvorjenju hidrofobnih IDP-protein vezavnih površin. Prisotnost nabitih ostankov (D, R) pa morda prispeva k kompenzaciji relativno visokega hidrofobnega karakterja teh peptidov in na ta način poskrbi, da α-vijačni IDP-ji v nevezani obliki ostanejo nestrukturirani.
Slika 9: Aminokislinska sestava IDP-jev iz zbirke v primerjavi z IDP-ji na splošno. Pozitivne vrednosti kažejo na večjo pojavnost določenega ak-ostanka glede na splošen podatkovni set IDP-jev ([33]), negativne vrednosti pa kažejo na primanjkljaj določenega ak-ostanka.
22
4.1.3 Deleži helične strukture IDP-jev v nevezanem stanju (predzvitost)
Povprečna stopnja zvitosti (delež α-vijačnice), ocenjena iz spektra CD (glej prilogo, tabela 6), za primere iz podatkovne zbirke znaša 17%. Večina vrednosti leži v območju od 0 do 30%, od tega ima tri četrtine primerov delež α-vijačne strukture manjši ali enak 10%. Od povprečja nekoliko bolj odstopajo štirje primeri, ki imajo v nevezanem stanju stopnjo zvitja nad 30%. Ti primeri so: BMF (67%), NOXA_B (51%), PaaA2 (37%) in FCP1 (35%). Porazdelitev vrednosti deleža α-vijačnice za zbirko IDP-jev je prikazana na sliki 10. Vidimo, da večina vrednosti leži okoli 17%, porazdelitev je dokaj ozka, izstopa pa nekaj primerov IDP-jev z visoko heličnostjo (rep proti desni).
4.1.4 Deleži helične strukture IDP-jev v vezanem stanju
Delež α-vijačnice v vezani obliki smo določali s pomočjo iskanja segmentov IDP-jev v kompleksu z njihovimi tarčami v bazi PDB. Število ak-ostankov, ki zavzamejo vijačno konformacijo, smo določili na podlagi njihovih torzijskih kotov s programom STRIDE.
Za razliko od nevezanega stanja imajo peptidi v vezanem stanju širšo porazdelitveno krivuljo, katere vrednosti segajo od 14% pa vse do 100% (povprečna heličnost znaša približno 60%, slika 10). Iz podatkov sledi, da se α-vijačni IDP-ji iz zbirke zvijajo do različne mere, pri tem pa povprečno povečanje deleža α-vijačnice znaša 42%. Pri tem velja omeniti, da vrednosti v vezanem in nevezanem stanju niso korelirane. Poleg tega pa uniformna porazdelitev heličnosti v nevezanem stanju in heterogena v vezanem stanju namigujeta na to, da imajo na strukturo α-vijačnih IDP-jev vpliv predvsem njihove tarče in ne toliko samo aminokislinsko zaporedje.
Slika 10: Delež zvitja α-vijačnih prepoznavnih elementov v prosti in vezani obliki. Z modro barvo je prikazana distribucija heličnosti v nevezani obliki, z oranžno barvo pa distribucija v vezani obliki.
23
4.1.5 Primerjava deležev heličnosti določenih eksperimentalno s tistimi določenimi na osnovi ak-zaporedja (AGADIR)
Delež helične strukture smo prav tako poskusili oceniti iz aminokislinskega zaporedja s pomočjo programa AGADIR. Ta program temelji na fizikalnem modelu za prehod helix- coil (prehod vijačnica-naključni klobčič), parametri modela pa so umerjeni z eksperimentalnimi vrednostmi α-vijačnic iz več sto peptidov. Ugotovili smo, da so deleži α-vijačnice napovedani z AGADIR-jem sistematično nižji kot tisti, ki jih določimo iz eksperimentalnih podatkov. Povprečje napovedanih heličnosti za podatkovni set je namreč le 4% (v primerjavi z eksperimentalno določeno vrednostjo 17%). V primeru omejenega seta podatkov (gre za 12 spektrov CD posnetih v našem laboratoriju) opazimo korelacijo med eksperimentalno določeno vrednostjo in AGADIR napovedjo (R=0,79, naklon = 0,16, slika 11). Naklon premice nakazuje na to, da AGADIR na splošno podceni delež α-vijačnice za faktor 4-6. Vzroki za takšno odstopanje niso popolnoma jasni. Morda je razlog v dejstvu, da je sam algoritem parametriziran na setu z alanini bogatih peptidov, ki se močno razlikujejo od teh, ki smo jih analizirali v naši podatkovni zbirki. Poleg tega lahko prisotnost aromatskih ak-ostankov pripomore k povečanju intenzitete signala CD in s tem privede do prekomerne ocene deleža α-vijačnice [34]. V podatkovni bazi je sicer 19 primerov, kjer najdemo aromatski ak-ostanek znotraj zaporedja peptida (ne na terminalnih pozicijah), pri katerih bi lahko sklepali, da je prišlo do precenitve deleža vijačnice. Seveda pa to ne razloži odstopanj med eksperimentalnimi vrednostmi in AGADIR napovedmi v vseh ostalih primerih. Na tem mestu omenimo še, da smo pri analizi naleteli na tri primere (peptidi PUMA127-161, PaaR235-63 in c-myc275-327), pri katerih se napoved dobro ujema z eksperimentalno določeno helično vsebnostjo. Vendar pa analiza aminokislinskih zaporedij teh peptidov ni identificirala nikakršnih posebnih lastnosti, ki bi razložile, zakaj v teh primerih prihaja do takšnega ujemanja.
Slika 11: Graf eksperimentalno določenih deležev α-vijačnice v odvisnosti od napovedi programa AGADIR. Eksperimentalne vrednosti za sisteme, izmerjene v našem laboratoriju, korelirajo z napovedmi AGADIR (R = 0,79, naklon = 0,16). Majhna vrednost naklona premice kaže na dejstvo, da AGADIR sistematično podceni delež α-vijačnice.
24
4.1.6 Levcinski motivi LXXLL stabilizirajo helično strukturo v nevezanem stanju Kako pojasnimo visoke vrednosti heličnosti IDP-jev v nevezanem stanju? Zelo pogost vezavni motiv, ki ga najdemo v intrinzično neurejenih transaktivacijskih domenah, je na primer hidrofobni motiv LXXLL, kjer L predstavlja levcin, X pa katerokoli drugo aminokislino. Vlogo levcinskih ostankov v tem motivu smo preučevali s pomočjo gostiteljskega zaporedja (ponovitev SETSTTSSS na začetku in koncu motiva), ki ima enak povprečen ΔGCH kot IDP-ji v naši podatkovni zbirki, in v odsotnosti motiva ni urejen ter ne kaže težnje po tvorbi α-vijačnice. Prisotnost treh levcinskih ostankov močno poveča heličnost (AGADIR) na račun večje težnje levcina po tvorbi α-vijačnice. V primeru, da so ti levcinski ostanki pravilno razporejeni v prostoru (mesta ki omogočajo interakcije stranskih skupin: i, i+3 in i, i+4), pa to še dodatno poveča heličnost (slika 12). Prisotnost takšnega vezavnega motiva torej vodi v bolj ugodne kontakte med IDP-jem in tarčnim proteinom ter vpliva na nastanek helične strukture.
Slika 12: Z levcinom bogati α-vijačni motivi stabilizirajo predzvite strukture IDP-jev. Naključno (gostiteljsko) zaporedje IDP, prikazano s črno neprekinjeno črto, ima nizko stopnjo vijačne strukture. Z dodatkom levcinskih ostankov pride do občutnega povečanja deleža α-vijačnice – rdeča črtkana črta. V primeru treh levcinskih ostankov, urejenih v obliki pogostega interakcijskega motiva LXXLL, je ta delež še nekoliko višji (črna črtkana črta).
25
4.1.7 Številni vezavni motivi IDP tudi stabilizirajo helično strukturo v nevezanem stanju
Na podlagi rezultatov motiva LXXLL smo se osredotočili tudi na druge tipične IDP vezavne motive in na to, kako ti prispevajo k rezidualni helični strukturi. V literaturi smo poiskali 20 takšnih motivov (tabela 7, priloga 2). Prisotnost predzvite strukture je za veliko motivov mogoče potrditi tudi z AGADIR izračuni (uporaba gostiteljskega zaporedja SETSTTSSS, enako kot v primeru motiva LXXLL, slika 13).
Slika 13: Grafični prikaz izračunov AGADIR za set 20 IDP vezavnih motivov. Z uporabo gostiteljskega zaporedja SETSTTSSS lahko, podobno kot opazimo v primeru motiva LXXLL, z uporabo programa AGADIR potrdimo prisotnost predzvite strukture tudi v nekaterih drugih IDP vezavnih motivih.
26
Na osnovi podatkovne zbirke 65 IDP-jev, ki se ob vezavi na svojo tarčo zvijejo v α- vijačnico, smo sistematično analizirali delež heličnosti v nevezani obliki (predzvitost).
Kljub temu da gre za intrinzično neurejene proteine, smo ugotovili, da imajo v nevezanem stanju znaten delež α-vijačne strukture, v povprečju 15%. Ob vezavi na tarčo se deleži α- vijačnice znatno povečajo, v povprečju za 40%.
V nadaljevanju smo skušali pojasniti še, katere sekvenčne značilnosti bi lahko stabilizirale α-vijačnico v nevezanem stanju. Predhodne raziskave so namreč pokazale tudi, da se lokacije α-vijačnice v nevezanem in vezanem stanju po navadi prekrivajo [14].
Glede na to je nadaljnja analiza ak-ostankov, ki so udeleženi v interakcije, pokazala, da so za nastanek le-teh zelo pomembni hidrofobni ostanki, še posebej pogost je levcin. Ob upoštevanju lastnosti levcina – to je izražena visoka težnja po tvorbi α-vijačnice in možnost tvorbe stabilizirajočih i, i+3 in i, i+4 interakcij stranskih skupin – ugotovimo, da verjetno igra pomembno vlogo v sklopljenosti helične strukture v obeh stanjih. Povezavo med rezidualno heličnostjo (predzvitostjo) in interakcijami s tarčo pa dobro ponazorijo nekateri splošno poznani α-helični prepoznavni motivi IDP-jev, kot je na primer levcinski motiv LXXLL. Prisotnost takšnega motiva po eni strani stabilizira rezidualno heličnost, po drugi strani pa omogoča ugodne kontakte z interakcijskim partnerjem. Poleg omenjenega motiva je v literaturi moč najti tudi druge primere motivov, za katere je značilna stabilizacija helične strukture v nevezani obliki.
27
4.2 Vezanje kameloidnih protiteles
4.2.1 Izotermna titracijska kalorimetrija (ITC)
Termodinamske parametre vezave kameloidnih protiteles (nanoteles), specifičnih za dva različna toksina (HigB2 in MazF), smo preučevali s pomočjo izotermne titracijske kalorimetrije (ITC). V tabeli 2 in 3 so prikazani termodinamski podatki, pridobljeni iz termogramov (priloga 4 za HigB2 in priloga 5 za MazF) pri dveh oziroma treh različnih temperaturah (20, 25 in 35°C). V nekaterih primerih (Nb6 in Nb8 za sistem HigB2 ter Nb12 za sistem MazF) je bilo vezanje pri nižji temperaturi prešibko, zato termogram ni bil primeren za integracijo in analizo. Posledično v teh primerih manjka podatek o spremembi toplotne kapacitete (ΔCp), za izračun katere sta potrebni vsaj 2 meritvi pri različnih temperaturah.
Tabela 2: Standardni termodinamski parametri vezave nanoteles specifičnih za toksin HigB2.
Hi gB2
Nanotelo log10(Ka25) Ka(25°C) ΔG°
[kcal/mol]
ΔH°
[kcal/mol]
ΔCp°
[cal/molK]
Nb1 9,300 2,00E+09 -12,69 -15,76 -504,62
Nb2 9,537 3,44E+09 -13,01 -32,65 -449,74
Nb4 9,791 6,18E+09 -13,36 -7,19 -658,65
Nb6 8,046 1,11E+08 -10,98 -14,21 -
Nb8 7,369 2,34E+07 -10,05 -5,22 -
Nb9 8,079 1,20E+08 -11,02 -21,58 -750,04
Nb10 7,708 5,11E+07 -10,52 -16,02 -675,02
Tabela 3: Standardni termodinamski podatki vezave nanoteles specifičnih za toksin MazF.
MazF
Nanotelo log10(Ka25) Ka(25°C) ΔG°
[kcal/mol]
ΔH°
[kcal/mol]
ΔCp°
[cal/molK]
Nb1 8,983 9,62E+08 -12,26 -19,67 -494,40
Nb2 8,610 4,07E+08 -11,75 -11,14 -466,13
Nb3 7,402 2,52E+07 -10,10 -12,23 -553,02
Nb4 8,239 1,73E+08 -11,24 -8,94 -490,69
Nb5 8,250 1,78E+08 -11,26 -21,13 -444,18
Nb6 7,866 7,35E+07 -10,73 -22,19 -853,59
Nb7 9,252 1,79E+09 -12,62 -24,55 -699,15
Nb8 6,652 4,49E+06 -9,07 -16,18 -1045,40
Nb9 7,720 5,25E+07 -10,53 -13,12 -692,31
Nb10 8,656 4,53E+08 -11,81 -6,38 -719,12
Nb11 6,863 7,29E+06 -9,36 -10,59 -186,47
Nb12 6,819 6,59E+06 -9,30 -12,39 -
Nb14 7,805 6,38E+07 -10,65 -18,15 -473,64
28
Za sistem HigB2 znaša povprečna eksperimentalno določena sprememba entalpije vezanja (ΔH°) -16,1 kcal/mol (vrednosti od -5,2 do -32,7 kcal/mol). Vrednosti spremembe Gibbsove proste energije (ΔG°) segajo od -10,1 do -13,4 kcal/mol (povprečje znaša -11,7 kcal/mol). Vrednosti za spremembo toplotne kapacitete (ΔCp°) se gibljejo med -448,7 in -750,0 cal/molK (povprečje 607,6 cal/molK).
V primeru sistema MazF znaša povprečna ΔH° -15,1 kcal/mol (od -6,4 do -24,6 kcal/mol). Vrednosti ΔG° se gibljejo med -9,1 in -12,6 kcal/mol (povprečje -10,8 kcal/mol). Povprečna ΔCp° je – 593,2 cal/molK (vrednosti od -186,5 do -1045,4 cal/molK).
4.2.2 Analiza aminokislinskega zaporedja variabilnih zank
Rezultati analize aminokislinske zgradbe hipervariabilnih regij (zank CDR) za sistema HigB2 in MazF so prikazani v tabeli 4 in tabeli 5. Opazimo lahko praktično uniformno dolžino zank CDR1 in CDR v primeru obeh sistemov (1 ak-ostanek krajši sta samo zanki CDR2 v primeru Nb8/HigB2 in Nb14/MazF). Poleg tega je opazna tudi nizka variabilnost v smislu aminokislinske sestave. V nasprotju z razmeroma konsistentno sestavo zank CDR1 in CDR2 pa je za zanke CDR3 značilna višja stopnja variabilnosti. Povprečna dolžina v primeru sistema HigB2 znaša 14,3 ostanka (10-18 ak-ostankov), v primeru MazF pa 20,6 (10-28 ak-ostankov). Delež polarnih ostankov v primeru HigB2 znaša kar 51%, za MazF pa 43,5%. Opazna je tudi večja raznolikost samih ak-ostankov, ki sestavljajo zanke CDR3.
Tabela 4: Zaporedja treh variabilnih regij (zank CDR) za set nanoteles proti HigB2. V zadnjem stolpcu je navedena dolžina zadnje variabilne regije – CDR3, pri kateri zasledimo, v primerjavi z zankama CDR1 in CDR2, največjo variabilnost.
HigB 2
Nanotelo CDR1 CDR2 CDR3 dolžina
Nb1 GFTL----DYYA ISSS--GGST AADFFCQTLTGRLPVLGS 18 Nb2 GFTL----DYYA ISSS--GGTT VADFACPLIREYDY 14 Nb4 GFTL----DYYA ISGT--DGSA AADVICPLLVAPPRGS 16 Nb6 GFTF----SNYA ISSV--GGST VARLS---LISDS 10 Nb8 GDRR----TIYT MTSS---GVT YEESRRPLGSRNTY 14 Nb9 GFTL----DYYA ISSS--GGST AADFTCPPIKAYDY 14 Nb10 GFTL----NHYA ISGS--DGST AVDFFCPLSRPDKY 14