• Rezultati Niso Bili Najdeni

Naslednje generacije določevanja nukleotidnih zaporedij

2.2 DOLOČEVANJE NUKLEOTIDNEGA ZAPOREDJA DNA .1 Zgodovinski pregled

2.2.2 Naslednje generacije določevanja nukleotidnih zaporedij

V zadnjih 25 letih se je z določevanjem zaporedij DNA popolnoma spremenil naš pogled na rastlinsko biologijo. Postala je mogoča določitev nukleotidnega zaporedja številnih genov in posledično tudi zaporedja ustreznih proteinov in njihovih funkcij. Informacije o genskih polimorfizmih so olajšale genetsko kartiranje, kloniranje genov in razumevanje evolucijsko pogojenih sorodstvenih vezi, ter omogočile začetek študija biotske raznolikosti (Delseny in sod., 2010).

Sangerjeva metoda je bila kar trideset let najbolj uporabljena metoda za določevanje nukleotidnih zaporedij. Nenehne potrebe po daljših odčitkih in hitrejšem določevanju zaporedja, so jo pripeljale do skoraj popolne optimizacije, vendar je kljub temu ostala razmeroma počasna in cenovno nedostopna za manjše raziskovalne skupine. Z napredki na področju mikrofluidov, nanotehnologije in informatike so se začele pojavljati nove, alternative metode sekvenciranja, ki so obetale še hitrejše in cenejše možnosti določevanja

zaporedja. Leta 2003 je J. Craig Venter Science Foundation obljubila 500.000 dolarjev nagrade tistemu, ki bo prvi določil zaporedja celotnega človeškega genoma za 1000 dolarjev, kar je spodbudilo tekmovanje med podjetji, za razvoj tehnike določevanja nukleotidnega zaporedja, ki bo to omogočala. Vse tehnike določevanja nukleotidnega zaporedja, ki so tako začele nastajati in imajo potencial za dosego tega cilja, poimenujemo s skupnim izrazom naslednje generacije sekvenciranja (NGS) (Delseny in sod., 2010).

Komercialno dostopne in trenutno najbolj uporabljene med novimi tehnikami so Rochev 454 pirosekvenator, Illumina tehnologija sekvenciranja s sintezo in SOLiD platforma podjetja Aplied Biosystems, ki uporablja sekvenciranje z ligacijo. Vse zgoraj naštete tehnologije imenujemo tudi tehnologije druge generacije sekvenciranja, saj predstavljajo obdobje, ki je sledilo po določevanju zaporedij z Sangerjevo metodo (Hamilton and Buell, 2012). V zadnjih letih pa so se pričele razvijati platforme naslednje generacije, ki jih uvrščamo v tretjo generacijo določevanja zaporedij. Te metode omogočajo določevanje zaporedja ene same molekule DNA, brez predhodnega pomnoževanja (angl. Single molecule sequencing). Med aparature tretje generacije, ki so tudi komercialno dostopne, uvrščamo Pacific Biosciences PacBio RS tehnologijo. Medtem ko vse tehnologije do sedaj uporabljajo za določevanje zaporedja emitacijo svetlobe, pa se platforma Ion Torrent odlikuje po tem, da je to prva naprava, ki ne meri svetlobe (angl. post-light sequencer), ampak meri spremembo pH (Rothberg in sod., 2011).

Naslednje generacije sekvenciranja imajo več različnih potencialnih aplikacij na področju genomike, kot je razvoj genetskih markerjev, QTL (ang. quantitative trait loci) kartiranje, analiza ekspresije genov, populacijska in asociacijska genetika in ne nazadnje določevanje nukleotidnega zaporedja celotnih genomov. Vsaka metoda ima na določenem področju svoje prednosti in pa tudi pomanjkljivosti, zato se raziskovalci poslužujejo tehnik glede na način in zahteve svojega dela. Za določevanja zaporedij modelnih organizmov, pri katerih je dostopna velika količina genomskih informacij, sta najpogosteje uporabljeni Illumina in SOLiD tehnologiji sekvenciranja, saj imata kljub krajšim dolžinam (35-150 baz) večji izkupiček sekvenc, ki pa jih pri modelnih organizmih lahko kartiramo na referenčni genom ali transkriptom. Vendar pa je večina objavljenih projektov na nemodelnih organizmih za določevanje zaporedij uporabila Roche 454 platformo, saj omogoča pridobitev daljših zaporedij (danes že do 1000 bp s platformo FLX+), ki jih je lažje sestaviti in bolje anotirati (Hamilton in Buell, 2012).

2.2.3 454 pirosekvenciranje

Leta 2005 so Marguiles in sod. poročali o novi, alternativni metodi določevanja nukleotidnega zaporedja, poznani kot pirosekvenciranje (Margulies in sod., 2005).

Platforma, ki je bila kreirana s strani družbe 454 Life Sciences in je danes last podjetja Roche, uporablja emulzijsko PCR reakcijo za namnoževanje fragmentov (Gupta, 2008).

Knjižnice DNA fragmentov se lahko konstruirajo s katerokoli metodo, ki producira kratke enoverižne fragmente, na katere so na koncu vezani adapterji. PCR (verižna reakcija s polimerazo) reakcija poteka v oljni raztopini s pomočjo nosilnih mikro kroglic (angl.

beads) na katere se vežejo DNA fragmenti knjižnice, ki jo želimo pomnožiti. Ti fragmenti imajo na koncih vezane specifične adapterje, ki so komplementarni adapterjem vezanim na nosilne mikro kroglice. Ob vezavi fragmenta na kroglico in hkratni tvorbi emulzijske reakcije med oljem in vodo se omogoči tvorba vodnih kapljic v katerih so ujete kroglice s pripetimi DNA fragmenti. V teh nastalih mikro reaktorjih se prične pomnoževanje fragmenta ob dodatku začetnih oligonukleotidov, ki imajo zaporedja komplementarna adapterjem na koncu fragmentov. Nastala dvoverižna DNA se zatem denaturira in novonastala veriga se s pomočjo adapterja pripne na krogljici na novo adaptersko zaporedje in postopek se ponovi. Ob koncu amplifikacije vsaka krogljica nosi nekaj milijonov kopij unikatnega DNA fragmenta. Sledi prekinitev emulzijske reakcije, denaturacija DNA in nanos kroglic na pikotiterske (PTP) plošče. Plošče vsebujejo milijone majhnih luknjic, v katere se lahko usede le po ena krogljica. Te luknjice predstavljajo individualne reaktorje za določevanje nukleotidnega zaporedja. 454 tehnologija uporablja za določevanje nukleotidnega zaporedja tako imenovano pirosekvenciranje, ki temelji na kemolumniscenci. Ta nastane s pomočjo encimske kaskade po sprostitvi pirofosfata ob vezavi nukleotidov. Ko se nukleotid veže na nastajajočo DNA molekulo s pomočjo DNA-polimeraze, se sprosti molekula pirofosfata. Pirofosfat se nato s pomočjo encima sulfurilaza pretvori v molekulo ATP, ta pa se porabi za oksidacijo luciferina z luciferazo pri čemer nastane kemiluminiscentni signal. Na PTP ploščo se nanašajo posamezni nukleotidi, opazuje pa se svetlobni signal, ki nastane ob vključevanju nukleotidov.

Sorazmerno s številom nukleotidov vključenih v zaporedje se veča moč signala. Po vključitvi nukleotida, aparat slika PTP ploščo, spere odvečne nukleotide in doda naslednjo bazo (Slika 9). Prve Roche 454 naprave so lahko določile zaporedja dolga do 110 bp, danes pa najnovejše nadgradnje naprave omogočajo branje dolžin tudi do 1000 bp (Diaz-Sanchez in sod., 2013). Glavna omejitev 454 sistema so homopolimerne regije DNA (zaporedja enakih baz, npr. (C)n, (A)n), saj lahko pride do napak pri odčitavanju intenzitete signala nukleotidov. Prednosti 454 sistema pa so njegovi relativno dolgi odčitki in hitrost postopka.

PCR emulzija

Izdelava knjižnice Nanos na PTP plošče

Roche 454 tehnologija:

Signal

Polimeraza

Začetni oligonukleotid

Luciferin

Svetloba + Oksi luciferin Sulfurilaza

Luciferaza

A A

454 pirosekvenciranje

Slika 9: Shematski prikaz poteka 454 pirosekvenciranja (Bajang in sod., 2011).

Figure 9: Schematic representation of 454 pyrosequencing (Bajabng et al., 2011).

Z uporabo platform naslednjih generacij sekvenciranja lahko raziskujemo transkriptome organizmov globlje in širše. Nižji stroški sekvenciranja, učinkovitejša sestava podatkov in možnost določitve številčnosti transkripta so omogočili vpogled v različne rastlinske vrste.

Kar zadeva rastline je bila Roche 454 tehnologija pogosto uporabljena pri določevanju zaporedij prepisov, saj daljša zaporedja dajejo več informacij in omogočajo enostavnejšo sestavo in obdelavo podatkov (Bajgain in sod., 2011; Troncoso-Ponce in sod., 2011).

Uporabili so jo pri določevanju novih transkriptov dobro poznanega genoma A. thaliana (Weber in sod., 2007) kot tudi pri določevanju visoko izraženih transkriptov genoma kumare (Cucumis sativus) (Ando and Grumet, 2010). Pri pšenici so bile analize genoma dolgo časa otežene, zaradi njegove velikosti in poliploidnosti. 454 Roche tehnologija je omogočila sekvenciranje 17 giga bp velikega, heksaploidnega genoma pšenice (Triticum Aestivum) (Brenchley in sod, 2012). Aegilops sharonensis je diploidni divji sorodnik pšenice in predstavlja nekakšen rezervar genetske raznovrstnosti, ter bi lahko imel pomemben agronomski pomen predvsem kot vir novih odpornosti na bolezni. Da bi pridobili genetske podatke so Bouyioukos in sod. (2013) s pomočjo Roche 454 tehnologije posekvencirali cDNA knjižnico pridobljeno iz tkiva listov dveh geografsko ločenih akcesij.

Določevanje zaporedij mnogih rastlinskih vrst je izboljšalo tudi razumevanje vloge podvojenih regij in transpozonov znotraj genoma. Pri dveh divjih sorodnikih pšenice, Aegilops cylindrica in A. geniculata, so Senerchia in sod. (2013) s pomočjo Roche 454 tehnologije določili zaporedja od katerih je več 70% predstavljalo zapise za znane traspozone (transposable elements – TE), predvsem LTR transpozone. Roche 454 tehnologijo so uporabili tudi Alagna in sod. (2009), ko so s primerjalnim sekvenciranjem štirih različnih cDNA zbirk dveh oljčnih genotipov pridobili informacije o spreminjanju genske ekspresije med razvojem oljčnih plodov in med dvema genotipoma. Munoz-Merida in sod. (2013) pa so s kombinacijo določevanja zaporedij s Sangerjem in 454 pirosekvenciranjem določili najobsežnejše število zaporedij do sedaj, v želji da bi določili ESTs iz različnih tkiv v različnih razvojnih stopnjah oljke. Iz 2 M podatkov so pridobili 81020 posameznih genov.