• Rezultati Niso Bili Najdeni

1 UVOD

Računalniška tomografija je slikovna metoda, s katero natančno slikamo posamezne dele telesa po rezinah s pomočjo rentgenskih žarkov in sodobne računalniške opreme. Celo telo ali samo del telesa lahko pregledamo v zelo tankih rezinah. Doza sevanja je pri tej preiskovalni metodi višja kot pri klasičnem rentgenskem slikanju. Uporabljamo jo, kadar nam klasično rentgensko slikanje ne poda zadostne informacije o prisotnosti, obsegu in lokaciji bolezenskega procesa (Klasinc et al., 2011).

V zadnjih nekaj letih se je razvoj novih načinov slikanja pomembno povečal, zato se v prihodnosti pričakuje razvoj računalniške analize medicinskih slik. Sprva so bili računalniški podporni sistemi razviti za odkrivanje raka na dojki pri mamografskem slikanju, nato pa so se ti sistemi začeli uporabljati tudi pri drugih diagnostikah, na primer pri diagnosticiranju pljučnega raka na CT slikah ipd. (Takahashi, Kajikawa, 2017).

Za pomoč radiologu pri interpretaciji CT slik je bilo razvitih nekaj računalniško podprtih sistemov, to so: Computer Aided Diagnosis (CADx), Computer aided detection (CADe) in Content-Based Medical Image Retrieval (CBMIR), (Nayantara et al., 2020).

Kotter in Langer (2011) opisujeta implementacijo CAD sistemov pri interpretaciji CT slik v sledečih anatomskih področjih:

• CT slikanje prsnih organov

• CT slikanje koronarnih arterij

• CT slikanje jeter

• CT slikanje debelega črevesja

• CT slikanje možganov

• CT slikanje skeleta

1.1 Strojno učenje

Strojno učenje je področje računalništva, ki se je razvilo na podlagi preučevanja in prepoznavanja vzorcev ter teorije računalniškega učenja v umetni inteligenci. Je proces ustvarjanja in učenja algoritmov, ki se lahko učijo ali napovedujejo podatkovne nize (Simon et al., 2015).

2

Obstajata dve glavni družini pristopov strojnega učenja – nadzorovano strojno učenje in nenadzorovano strojno učenje. Oba pristopa uporabljata nabore podatkov za učenje modelov, ki jih lahko nato uporabimo na novih podatkih za klasifikacijo ali napovedovanje (Yanase, Triantaphyllou, 2019).

1.1.1 Nadzorovano strojno učenje

Pri tem postopku je program naučen na že vnaprej določenih podatkih in jih nato uporabi za klasifikacijo ali napovedovanje na novih podatkih (Simon et al., 2015).

Pod nadzorovano strojno učenje spadajo naslednji postopki in modeli: metoda podpornih vektorjev (ang. support vector machines (SVM)), odločitvena drevesa (ang. decision trees), umetne nevronske mreže (ANN), z globokimi nevronskimi mrežami kot npr. konvolucijska nevronska mreža (CNN), regresijski modeli (logistična in linearna regresija) (Yanase, Triantaphyllou, 2019).

Modeli nevronskih mrež delujejo po principu človeških možganov. Sestavljeni so iz množice umetnih nevronov. Lahko se jih organizira tako, da lahko mreža izvaja določene naloge (npr.

prepoznavanje vzorcev, obdelavo signalov ipd.), zato se lahko uporablja na različnih strokovnih področjih. Imajo sposobnost učenja s pomočjo vhodnih podatkov ali brez njih.

Osnovni elementi nevronske mreže so umetni nevroni, ki so sestavljeni iz slojev. Morajo imeti vsaj dva (vhodni in izhodni) ter vmesne sloje, ki se imenujejo skriti sloji, med katerimi potekajo signali. Vhodni signal mora biti dovolj velik, da signal steče od enega nevrona do drugega. Nevroni so sestavljeni iz štirih osnovnih elementov: sinapse ali komunikacijske povezave, seštevalnika za seštevanje vhodnih signalov, aktivacijske funkcije za omejevanje amplitude izhodnega nevrona in zunanjo utežjo vhodov. Preprost prikaz sheme nevronske mreže z enim skritim slojem je prikazan na Sliki 1 (Csáji, 2001).

3

Slika 1: Preprost prikaz sheme nevronske mreže z enim skritim slojem (Vir: Csáji, 2001) Pristop podpornih vektorjev (SVM) temelji na optimizaciji. Osnovna ideja te metode je, da loči med seboj dva razreda podatkov z iskanjem meje v obliki hiperravnin v višje dimenzionalnih prostorih. Pri tem uporabljamo različne jedrne funkcije, ki pretvarjajo podatke v višje dimenzionalne prostore, kjer jih lahko ločujemo z linearnimi mejami (Tan et al., 2006).

Pri regresijskih metodah gradimo statistične modele, ki jih uporabimo za napovedovanje odzivne spremenljivke (običajno Y) na podlagi ene ali več opisnih spremenljivk (običajno X). Pri linearni regresiji je napovedni model v obliki linearne funkcije, kjer ugotavljamo osnovne povezave med opisnimi in odzivnimi spremenljivkami (Žibert, 2020).

Regresijski model, ki se najpogosteje uporablja pri strojnem učenju, je model logistične regresije, kjer je odzivna spremenljivka kategorijska (običajno binarna) in z modelom napovedujemo verjetnost odziva v eni izmed stopenj kategorije na podlagi več opisnih spremenljivk (Žibert, 2020).

Odziv modela logistične regresije je funkcija v obliki črke S, zato ji pravimo tudi ''sigmoidna funkcija'' (Rangayyan et al., 2010).

1.1.2 Nenadzorovano strojno učenje

Pri tej metodi učenja so podane vhodne vrednosti podatkov, ne pa tudi želene vrednosti izhodnih podatkov. Algoritmi v procesu učenja pregledajo vhodne podatke in jih po svojih

4

kriterijih razvrstijo v različne skupine. Rezultat nenadzorovanega učenja ni vnaprej določen (Ploj, 2019).

Med postopke nenadzorovanega učenja spada postopek rojenja podatkov (ang. Clustering), kjer se učni podatki z isto želeno izhodno vrednostjo in na podlagi mere podobnosti združujejo v skupine, ki jim pravimo roji (Ploj, 2019).

Postopkov rojenja je več. Postopek K-tih povprečij je eden izmed standardnih in najbolj uporabljenih postopkov. Pri tem postopku rojimo podatke k središčnim točkam rojev, ki jih računamo kot povprečja rojev. Vnaprej izberemo število rojev oziroma povprečij in okoli njih rojimo podatke po kriteriju najkrajše podobnostne razdalje. Postopek je iterativen, kjer v prvi iteraciji izberemo K-naključno izbranih točk v množici točk, ki jih rojimo in nato popravljamo izračune povprečij toliko časa, dokler se podatki ne uredijo okoli teh točk. Na ta način dobimo K-rojev okoli K-središčnih točk. Tak postopek rojenja pogosto uporabljamo pri segmentacijah medicinskih in ostalih slik (Yanase, Triantaphyllou, 2019).

1.1.3 Globoko učenje

Metoda globokega učenja je pridobila v zadnjih nekaj letih zelo veliko pozornosti. Zaradi vse večje računske moči računalnikov in velikih količin slikovnih podatkov se ti sistemi zelo hitro razvijajo. Imajo sposobnost samostojnega učenja ''značilk'', ki jih ni potrebno vnaprej definirati, kot je to običajno pri ostalih postopkih strojnega učenja, poleg tega pa izvajajo še klasifikacijo. V primeru dovolj velikega nabora medicinskih slikovnih podatkov lahko sistemi samostojno prepoznajo obolela tkiva brez predhodne strokovne obdelave podatkov (Hosny et al., 2018).

Metoda dosega izjemne rezultate klasifikacije na več področjih (Pongrac et al., 2017).

Konvolucijska nevronska mreža (ang. convolution neural network, CNN) je ena izmed tipičnih metod globokega učenja. Poznamo veliko različnih modelov globokih konvolucijskih nevronskih mrež. Vsak izmed njih pa je namenjen za opravljanje specifičnega problema. V splošnem pa je konvolucijska nevronska mreža večplastna.

Sestavljena je iz vhodne plasti, sledijo ji izbirne plasti, namenjene pod-vzorčenju in regularizaciji. Končajo se s popolnoma povezanimi plastmi. Vhodni podatek lahko predstavlja slika, ki jo obdelamo z več filtri. Odziv filtra določimo s konvolucijo, ki kodira

5

vhodne podatke in določa značilke, z uporabo pod-vzorčenja pa zmanjšuje dimenzijo. Odziv filtrov predstavljajo vhodni podatki aktivacijskih funkcij brez nasičenja, izvajamo npr. z usmernimi linearnimi enotami (ReLU), ki so vključene v nelinearne procese nasičenja.

Funkcije so uporabljene po vsaki konvoluciji in povezani plasti. Zadnja plast uporablja normalizirano eksponentno funkcijo, npr. ''Softmax'' kot izhodno aktivacijsko funkcijo.

Rezultat je po navadi pod-vzorčen, saj se s tem zmanjšajo dimenzije značilk. Kadar uporabimo ''max-pool'' diskretizacijo, ta 2x2 plast razdeli izhod v vzorce z 2x2 celici, katere se ne prekrivajo (Pongrac et al., 2017).

Na sliki je prikazana globoka konvolucijska nevronska mreža z 10 sloji, avtorjev Pongrac in njegovih sodelavcev (2017). Ima dve konvolucijski plasti, dve ''Max-pool'' plasti, dve polno povezani plasti in na izhodni strani je povezava med ''Softmax'' funkcijo in klasifikatorjem.

Vhodna slika je potisnjena v vhodni sloj kot produkt števila stolpcev (h) in števila vrstic (w).

Sliko so filtrirali s 30 konvolucijskimi filtri velikosti 2x2 v prvi konvolucijski plasti. Filter v drugi konvolucijski plasti ima velikost 2x2. Rezultat je 50 značilk velikosti (h/2) x (h/2), po drugi ''max-pool'' plasti postanejo te velikosti (h/4) x(h/4). Nato so uporabili ReLU nelinearnost v drugi polno povezani pasti. Dobili so 6 enot oz. število razredov. Na koncu so uporabili klasifikator s ''softmax'' funkcijo, s čimer so določili verjetnost vsakega razreda (Pongrac et al., 2017).

Slika 2: Konvolucijska nevronska mreža z 10 plastmi (Vir: Pongrac et al., 2017) Na Sliki 3 je shematsko prikazana razlika med najpogosteje uporabljenima metodama umetne inteligence. Prva metoda temelji na ročno označenih značilkah, ki jih označujejo inženirji, in so opredeljene z matematičnimi enačbami (npr. oris oblike tumorja). Zato jih je mogoče opredeliti z računalniškimi programi. Uporabljajo se kot vhodni podatki za učenje metod strojnega učenja, ki prepoznavajo patologije na medicinskih slikah. Ker se vnaprej določene funkcije ne morejo v vseh primerih prilagoditi na različne podatke, to predstavlja njihovo slabost (Hosny et al., 2018).

6

Metode globokega učenja ne zahtevajo predhodno označenih značilk. Samodejno lahko prepoznajo značilnosti človeških tkiv in so odporne na neželene spremembe, npr.

variabilnost med ocenami CT slik različnih bralcev, kar predstavlja večjo objektivnost. Za razliko od prejšnje metode se ti algoritmi lahko prilagajajo najrazličnejšim vhodnim podatkom. Uporabniku prihranijo čas zaradi samostojnega učenja in označevanja (Hosny et al., 2018).

Slika 3: Shema prikazuje 2 metodi za klasifikacijo medicinskih slik, na primer podajanje diagnoze. (a) metoda temelji na klasifikaciji interesnih območji ali značilk, ki jih predhodno označi strokovni operater. Metoda na podlagi obsega, oblike, teksture in intenzivnosti lokacije interesnega območja, poda rezultate o klasifikaciji patologije. (b) metoda globokega učenja ne zahteva označitve interesnega območja. Sestavljena je iz več

plasti, kjer se med učenjem algoritmov istočasno izvaja ekstrakcija, izbira interesnega območja in na koncu klasifikacija ali detekcija. Plasti se morajo naučiti višjih računskih

funkcij, istočasno pa se učijo abstraktnih oblik (črte, sence,…), ostale plasti pa se učijo oblike celotnih organov ali predmetov (vir: Hosny et al., 2018)