2.2.1 Kamere
Za izbiro kamere je potrebno dobro razumevanja problema, ki ga rešujemo in na podlagi tega izberemo ustrezno napravo. Prva pomembna lastnost je, če ima kamera zmožnost izdelave globinske (3D) slike. To je uporabno če želimo natančno pozicijo ter tretjo dimenzijo opazovanega objekta čim bolj popisati v naši aplikaciji. V primeru da je cilj povezan s prepoznavanjem barve objekta (npr. zrelost paradižnikov) in natančnost pozicije ni tako pomembna, pa je izbira navadne 2D kamere dobra. Druge specifikacije, ki so pomembne pri kameri so njena ločljivost, velikost slikovnega senzorja, maksimalno število slik na sekundo (FPS), hitrost prenosa podatkov ter cena.
Teoretične osnove
9 V industrijskih aplikacijah je velikokrat globinski modul ločen od barvnega, vendar je možen nakup ali 3D tiskanje okvirja, v katerega sta modula vstavljena, da sta kameri na specifični razdalji in je tako možno uporabiti integrirano funkcijo za usklajevanje barvne ter globinske slike. Primer tiskane rešitve je prikazan na sliki 2.10.
Slika 2.10: Primer 3D tiskane rešitve za združevanje 2D RGB ter globinske kamere [6]
2.2.2 Zapis 2D slike in barvni prostori
Za predstavitev digitalnega zapisa sivinske slike je potrebnih nekaj predpostavk. Imamo dve spremenljivki i in j za katere velja 1 ≤ i ≤ 𝑥 in 1 ≤ j ≤ 𝑦 in funkcijo 𝑓s(i,j), ki označuje
Maksimalne vrednosti 𝑥, 𝑦 ter M so lastnsti kamere, 𝑥 in 𝑦 predstavljata ločljivost, M pa maksimalno intenziteto določeno s številom dodeljenih bitov [7].
Zgoraj je opisan sivinski barvni prostor, obstajajo pa še taki, ki za intenziteto barve nimajo dodeljene samo ene spremenljivke. S tem omogočajo barvni zapis slike.
RGB/BGR ([R]Rdeča, [G]Zelena, [B]Modra)
RGB barvni sistem katere model je prikazan na sliki 2.11, je sestavljen iz treh spremenljivk.
Vsaka predstavlja eno barvo (rdeča, zelena in modra), kombinacije le teh pa sestavijo vse ostale. Za vsako sliko so narejeni trije zapisi, en za vsako od teh spremenljivk, nakar so te postavljene ena čez drugo tako, da se prekrivajo in se barve združijo. Velikost slike tako postane trikrat večja kot navadna sivinska.
10
Slika 2.11: Prikaz barvnega modela RGB [8]
HSV ([H]Odtenek [S]Nasičenost [V]Vrednost)
HSV je barvni prostor katerega model je prikazan na sliki 2.12, opisuje barvno sliko kot odtenek, nasičenost in vrednost. Odtenek pove kakšna je bazična barva, nasičenost pove če kako bleda je ta barva in vrednost kako temna je. V robotskem vidu ima prednost pred RGB barvnim prostorom, kadar je en od parametrov za prepoznavanje objekta njegova barva, saj so vsi odtenki enkapsulirani v spremenljivki H. Ena od težav pa je da so robne vrednosti odtenka pripisane rdeči barvi (prehod v oranžno, ter prehod v vijolično) to je pogosto rešeno tako, da barvo slike obrnemo in nato iščemo odtenke modre, ki pa nima te težave.
Slika 2.12: HSV barvni model[9]
Teoretične osnove
11
2.2.3 Tri-dimenzionalno slikanje površin
Poznamo tri metode za tri-dimenzionalno slikanje (ang. 3D imaging); kontaktna, prenosna (transmisivna) ter odsevna.
Kontaktna metoda zbira podatke o obliki preko fizičnega kontakta z objektom. Je počasna in lahko poškoduje izdelek poda pa zelo natančne in točne podatke. Primer je Koordinatni Merilni Stroj (KMS), ki se pogosto uporablja v industrijskem okolju za preverjanje pravilnosti kosov. Na sliki 2.13 je nazorno prikazano zaznavanje oblike površine s kontaktno metodo.
Slika 2.13: Nazorni prikaz delovanja kontatknega slikanja [10]
Prenosna metoda uporablja senzorje, ki zaznavajo sproščanje energije v objektu za določanje oblike. Večinoma se tehnika uporablja v medicini v obliki Magnetne Resonance (MRI), Računalniške Tomografije (CT) ali Pozitronske Emisijke Tomografije (PET). Kjer ločujejo različne dele telesa glede na to koliko energije oddajo, ko jih stimulirajo na različne načine.
Odsevna ali reflektivna metoda je lahko optična ali ne optična. Primer ne optične metode je sonar, ki zazna objekte tako, da pošlje ultrazvočne valove in nato zaznava odboje na objektu. Informacije niso natančne so pa uporabne za ugotavljanje generalne pozicije in oblike. Uporaba sonarja je pogosta v ribolovu.
Optična odsevna metoda deluje v dražjih iteracijah na principu časa preleta (ang. Time of Flight), v bolj komercialno dostopnih primerih pa se uporablja princip strukturirane svetlobe, primer delovanja je prikazan na sliki 2.14, kjer sveti vzorec v infrardečem spektru, in z eno ali več kamerami z IR filtrom preverja kako je ta vzorec deformiran [8]. Druga možnost pa je zaznavanje globine s stereoskopskim vidom.
12
Slika 2.14: Prikaz deformacije vzorca pri principu strukturirane svetlobe [11]
Stereoskopski vid
Podobno kot človeški vid stereoskopske kamere posnamejo dve sliki ter jih primerjajo med seboj. Ker je razdalja med zaznavali znana, je možen preračun oddaljenosti objekta od kamere.
Slika 2.15: Nazoren prikaz delovanja stereoskopske kamere [7]
Na sliki 2.15 je prikazan je prizor na katerem je zaznana točka P na razdalji 𝑧. Zaznali sta ga dve kameri, ki sta zamaknjeni za 𝛥𝑠 in imata enako goriščno razdaljo 𝑓. Točka je projicirana na oba senzorja z zamikom 𝑑1 oziroma 𝑑2. Tako veljata relaciji (2.2):
𝑑1 𝑥d = 𝑓
𝑧 za levo kamero in 𝑑2
𝛥𝑠 − 𝑥d= 𝑓
𝑧 za desno kamero (2.2)
Teoretične osnove
13 Razdalja je lahko tako preračunana po formuli (2.3).
𝑑 = 𝑑1 + 𝑑2 =𝑓 ∙𝑥d
Na sliki se vidi tudi, da ima stereoskopski vid maksimalno dolžino na kateri je še efektiven saj postaneta sliki obeh kamer že preveč podobni za primerjavo. Ima pa tudi minimalno dolžino efektivnosti, ki pa je pogojena s širino senzorjev [7].
Za dodatno pomoč pri zaznavanju, uporabljajo nekatere kamere še IR vzorec, kot dodaten šum, ki ga kameri lahko zaznata, slika 2.16 prikazuje vzorec kamere uporabljene v tej nalogi.
Te vzorci so ponavadi specifične oblike, ki jih zaznavala poznajo in si tako povišajo možnosti, da bo globina razbrana pravilno [12].
Slika 2.16: Oblika vzorca, ki ga projicira kamera Intel D435 [12]
2.2.4 Shranjevanje 3D slike
Od naštetih načinov za 3D slikanje je kontaktna tako natančna, da lahko modele narejene s podatki pridobljenimi na ta način direktno pretvorimo v standardne formate za 3D objekte (STL ali OBJ), za ostale pa so podatki, večino časa pomanjkljivi in potrebujejo za tako pretvorbo še vmesne procese, ki na podlagi prejetih podatkov ekstrapolirajo, kako izgledajo tisti deli, ki so slabše popisani. Za uporabo v industrijskem zaznavanju potrebujemo popisane samo določene točke zato ti procesi niso potrebni. V tem primeru se globinski podatki shranijo v oblak točk ali globinsko sliko. Oblak točk je skupek točk, ki imajo definirane koordinate X, Y in Z in tako sestavijo ter vizualizirajo 3D objekt. Slika 2.17 prikazuje primer oblaka točk za model torusa.
14
Slika 2.17: Dva pogleda na oblak točk modela torusa [13]
Slika 2.18 pa prikazuje globinski zemljevid, ki deluje bolj kot 2D slika, le da ima še za vsako ima za vsako točko posnetka shranjeno samo razdaljo od kamere do opazovane točke.
Slika 2.18: Prikaz globinske slike (A) glede na zajeto sliko (B) [14]