UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Matematika – 1. stopnja Tim Mulej Normalne matrike Delo diplomskega seminarja Mentor: prof. dr. Roman Drnovšek Ljubljana, 2021

(1)

UNIVERZA V LJUBLJANI

FAKULTETA ZA MATEMATIKO IN FIZIKO Matematika – 1. stopnja

Tim Mulej Normalne matrike

Delo diplomskega seminarja

Mentor: prof. dr. Roman Drnovšek

Ljubljana, 2021

(2)

Kazalo

1. Uvod 4

2. Osnovne definicije 4

3. Razcepi matrik 7

3.1. Schurov razcep 7

3.2. Polarni razcep 8

4. Karakteristične lastnosti normalnih matrik 11

5. Hoffman-Wielandtov izrek 21

5.1. Birkhoffov izrek 22

6. Slovar strokovnih izrazov 27

Literatura 27

(3)

Normalne matrike

Povzetek

Normalnost matrik je eno od bolj zanimivih poglavij linearne algebre. Ne samo zato, ker imajo normalne matrike razmeroma preprosto definicijo, ampak tudi zato, ker so uporabne v praksi, kar je razlog, da je bilo odkritih že 89karakterističnih lastnosti normalnih matrik. V tem delu smo si izbrali25karakterističnih lastnosti in pokazali ekvivalence med njimi. Posvetili pa smo se tudi vprašanju, kako “blizu” sta si dve kvadratni matriki glede na njune lastne vrednosti. Ali še bolj zanimivo, kaj se zgodi z lastnimi vrednostmi matrike, če matriko malo perturbiramo. V tem delu smo na ti dve vprašanji odgovorili za normalne matrike.

Normal matrices

Abstract

Matrix normality is one of the most interesting topics in linear algebra and matrix theory, since normal matrices have not only simple structures under unitary simila- rity but also many applications, which is why a great deal of work has been done on them. There are89 different characteristic properties. In this thesis we chose25 of those characteristic properties and proved their equivalence to basic definition of normal matrices. We were also interested in how “close” are the matrices in terms of their eigenvalues. More interestingly, if a matrix is “perturbed” a little bit, how would the eigenvalues of the matrix change? In this thesis we present answers to these two questions if the matrices are normal.

Math. Subj. Class. (2020): 15B99

Ključne besede: matrika, lastna vrednost, lastni vektor, Schurov razcep, polarni razcep, Hoffman-Wielandtov izrek, Sunov izrek

Keywords: matrix, eigenvalue, eigenvector, Schur decomposition, polar decomposition, Hoffman–Wielandt theorem, Sun theorem

(4)

1. Uvod

Množica normalnih matrik nima nobene algebraične strukture, kot jo ima na primer množica ortogonalnih matrik, ki je grupa. Za poljubni dve normalni matriki niti ne velja, da je njun produkt nujno normalna matrika, torej množica normalnih matrik ni zaprta za množenje. Zato bi se morda komu pojavilo vprašanje, zakaj bi jim posvečali toliko pozornosti. Na to vprašanje bomo poskusili odgovoriti v tem diplomskem delu tako, da bomo navedli seznam lastnosti, ki veljajo za normalne matrike, in s tem pokazali zanimivost le-teh. Veliko rezultatov dela je preprostih, vendar nam lahko pomagajo pri uporabi normalnih matrik v praksi, ali pa jih lahko razširimo na normalne operatorje na neskončno dimenzionalnih Hilbertovih prosto- rih.

Najbolj uporabne podmnožice normalnih matrik so hermitske (A^∗ = A), unitarne (U^∗U = I) in antihermitske matrike (A^∗ = −A), ki se večkrat pojavijo pri numeričnem računanju analize napak.

Prvi seznam karakterističnih lastnosti za normalne matrike so objavili matematiki Grone, Johnson, Sa in Wolkowicz leta 1987, ki je vseboval 70 lastnosti [5]. Nato pa sta leta 1998 matematika Elsner in Ikramov temu seznamu dodala še dodatnih 19 lastnosti [6].

V drugem poglavju so zbrane osnovne definicije, na katerih temeljijo glavni izreki tega dela. V naslednjem poglavju sta razložena Schurov in polarni razcep, ki smo ju uporabili za dokazovanje nekaterih ekvivalenc med lastnostmi normalnih matrik.

Četrto poglavje vsebuje že prej omenjene karakteristične lastnosti in dokaze povezav med njimi. V zadnjem poglavju pa smo se posvetili Hoffman-Wielandtovem izreku, ki pove, za koliko se lahko lastne vrednosti dveh normalnih matrik razlikujejo. Potem pa smo si ogledali še Sunov izrek, ki je podoben Hoffman-Wielandtovem izreku, samo da si ogledamo razlike lastnih vrednosti med normalno in poljubno matriko. Nato smo podali še primer, ki pokaže, da je predpostavka o normalnosti začetne matrike pomembna.

2. Osnovne definicije

Za začetek navedimo nekaj definicij za lažje razumevanje nadaljnjega besedila.

Definicija 2.1. Matrika A ∈ C^n×n je normalna, če komutira s svojo hermitsko transponiranko, torej velja

A^∗A=AA^∗.

Definicija 2.2. Matrika U ∈C^n×n je unitarna, če je matrika U^∗ njen inverz, torej U U^∗ =U^∗U =I.

Definicija 2.3. Matrika H ∈ C^n×n je hermitska, če je enaka svoji hermitski tran- sponiranki, torej

H =H^∗.

Definicija 2.4. Matrika D ∈ C^n×n je diagonalna, če so vsi njeni koeficienti izven diagonale enaki nič, torej

d_ij = 0, če je i̸=j,

kjer sodij koeficienti matrikeD. Zapišemo jo lahko tudi kotD= diag(d1, d2, . . . , dn).

(5)

Definicija 2.5. Matrika T ∈ C^n×n je zgornje trikotna, če so vsi njeni koeficienti pod diagonalo enaki nič, torej

t_ij = 0, če je i > j.

Definicija 2.6. Matrika M ∈C^n×n je idempotentna, če za njo velja M² =M.

Definicija 2.7. Kvadratna hermitska matrikaP ∈C^n×n jepozitivno semi-definitna, če za vsak x∈Cⁿ velja

⟨P x, x⟩ ≥0.

Da je matrika P pozitivno semi-definitna, lahko zapišemo tudi kotP ≥0.

Definicija 2.8. Matrika P ∈R^n×n je permutacijska, če vsaka njena vrstica in vsak njen stolpec vsebujeta natanko eno 1, vsi ostali koeficienti pa so enaki 0.

Permutacijskih matrik velikosti n × n je natanko n!. Množica permutacijskih matrik velikosti n ×n tvori grupo, kjer je P⁻¹ = P^T. To lahko opazimo, če si produkt matrik P in P^T pogledamo po elementih

(︁P P^T)︁

ij =

n

∑︂

k=1

pikp^T_kj =

n

∑︂

k=1

pikpjk,

kjer sopij koeficienti matrikeP inp^T_ij koeficienti matrikeP^T. Ker ima permutacijska matrika v vsakem stolpcu samo en koeficient enak 1, velja

(P P^T)_ij =

{︄1 i=j 0 i̸=j . Torej je

P P^T =I.

Od tod vidimo, da so permutacijske matrike podmnožica unitarnih matrik.

Definicija 2.9. Matrika S = (s_ij) ∈ R^n×n je dvojno stohastična, če se vse njene vrstice in stolpci seštejejo v ena in ima vse koeficiente nenegativne. Ali povedano drugače,

e^TS =e^T in Se=e, kjer je e = (1,1, . . . ,1)^T in s_i,j ≥0.

Ker se koeficienti dvojno stohastične matrike v vsaki vrstici in v vsakem stolpcu seštejejo v ena, se te matrike velikokrat pojavljajo v verjetnosti.

Definicija 2.10. Sled matrike A = (a_ij) ∈ C^n×n je vsota njenih diagonalnih ele- mentov:

sled(A) =

n

∑︂

i=1

a_ii.

Zaradi koristnih lasnosti se sled matrike velikokrat uporablja pri računanju z matrikami. Ena izmed bolj uporabnih je, da za kvadratni matriki A, B ∈ C^n×n velja

sled(AB) = sled(BA).

(6)

To dokažemo po definiciji sled(AB) =

n

∑︂

i=1 n

∑︂

j=1

a_ijb_ji =

n

∑︂

j=1 n

∑︂

i=1

b_jia_ij = sled(BA).

Zgornji dokaz smo našli na spletni strani [9].

To lastnost pa lahko posplošimo, torej sled je invariantna na ciklične permutacije.

To je preprosto dokazati za tri matrike, za več matrik pa nadaljujemo induktivno.

Naj bo matrika B produkt matrik C in D. Potem lahko zapišemo sled(ACD) = sled(AB) = sled(BA) = sled(CDA).

Sedaj je preprosto videti, da je sled matrike A res enaka vsoti lastnih vrednosti matrike A: če izračunamo Jordanovo kanonično formo matrike A, dobimo A = P⁻¹J P, kjer ima J po diagonali lastne vrednosti matrike A. Sedaj uporabimo zgornjo enakost in dobimo

sledA= sledP⁻¹J P = sledJ P P⁻¹ = sledJ.

Na spletni vtrani [10] so singularne vrednosti razložene kot:

Definicija 2.11. Singularna vrednost σmatrikeA∈C^m×nje kvadratni koren lastne vrednosti produkta matrik A^∗A. Torej je σ ničla polinoma

det(A^∗A−λ²I).

Obstaja tudi preprosta geometrijska interpretacija singularnih vrednosti matrike A. Predstavljajmo si enotsko sfero. Če jo preslikamo z A, dobimo elipsoid. Singu- larne vrednosti matrike Apredstavljajo polosi elipsoida. To je preprosto pokazati z polarnim razcepom, ki ga dokažemo v naslednjem poglavju, zato bomo natančnejšo razlago pustili za kasneje.

Definicija 2.12. Konveksna kombinacija je linearna kombinacija vektorjev, kjer so vsi koeficienti nenegativni in se seštejejo v ena.

Matriki lahko na več načinov dodelimo število, na primer izračunamo njeno de- terminanto, sled, največjo lastno vrednost. Eden izmed bolj uporabnih načinov je, da izračunamo njeno matrično normo.

Definicija 2.13. Naj bo C^n×n vektorski prostor vseh kompleksnih n ×n matrik.

Potem je matrična funkcija ∥·∥ : C^n×n → R matrična norma, če za vsaki A, B ∈ C^n×n in vsak c∈C velja:

(1) ∥A∥ ≥0; enakost velja natanko tedaj, ko jeA= 0, (2) ∥cA∥=|c| ∥A∥,

(3) ∥A+B∥ ≤ ∥A∥+∥B∥, (4) ∥AB∥ ≤ ∥A∥ ∥B∥.

Matrična norma, ki jo bomo uporabljali v tem delu, je definirana kot:

Definicija 2.14. Za poljubno matriko A∈C^n×n definiramo

∥A∥_F = (sled(A^∗A))^1/2 = (︄ _n

∑︂

i,j=1

|aij|² )︄1/2

. Tej matrični funkciji pravimo Frobeniusova norma.

(7)

Frobeniusova norma je matrična norma, ker za vsaki matriki A, B ∈ C^n×n in za vsak c∈C zadošča pogojem:

∥A∥_F =(︂

∑︁n

i,j=1|a_ij|²)︂1/2

>0 razen, če je A= 0, potem je ∥A∥_F = 0,

∥cA∥_F =|c|(︂

∑︁n

i,j=1|aij|²)︂1/2

=|c| ∥A∥ za vse c∈C,

Matriki A in B spremenimo v vektorja velikosti n×n tako, da vrstice matrike zapišemo zaporedoma, na način v_A= (a₁₁, a₁₂, . . . , a_1n, a₂₁, . . . , a_nn). Potem je Fro- beniusova norma za matriko A enaka evklidski normi za vektor v_A, kar nam da

∥A+B∥_F =∥vA+vB∥₂ ≤ ∥vA∥₂+∥vB∥₂ =∥A∥_F +∥B∥_F .

Koeficiente matrike AB si predstavljamo kot skalarne produkte vrstic a_i matrike A in stolpcev b_j matrike B. Potem uporabimo Cauchy–Schwarzovo neenakost in dobimo

∥AB∥_F = (︄ _n

∑︂

i,j=1

|⟨a_i, b_j⟩|² )︄1/2

≤ (︄ _n

∑︂

i,j=1

∥a_i∥²∥b_j∥² )︄1/2

= (︄ _n

∑︂

i=1

∥a_i∥²_F

)︄1/2(︄ _n

∑︂

j=1

∥b_j∥²_F )︄1/2

=∥A∥_F ∥B∥_F .

Dokaz, da je Frobeniusova norma matrična norma smo povzeli po dokazu v Wil- liamovi Fordovi knjigi z naslovom Numerical linear algebra with applications [2, Poglavje 7]. Ker je sled matrike enaka vsoti njenih lastnih vrednosti, je preprosto videti, da velja tudi

∥A∥_F = (sled(A^∗A))^1/2 = (︄ _n

∑︂

i=1

σ_i²(A) )︄1/2

,

kjer so σ_i singularne vrednosti matrike A. Poleg te lastnosti pa lahko še opazimo, da je Frobeniusova norma unitarno invariantna norma, kar pomeni, da za poljubno matriko A∈C^n×n in za vsaki unitarni matriki U, V ∈C^n×n velja

∥U AV∥_F = sled(V^∗A^∗AV) = sled(A^∗A) = ∥A∥_F. 3. Razcepi matrik

V tem poglavju si bomo ogledali dva razcepa matrik. Prvi bo Schurov razcep, drugi pa polarni razcep.

3.1. Schurov razcep. Iskanje lastnih vrednosti matrik je računsko zahtevna ope- racija. Lahko izračunamo Jordanovo kanonično formo matrike, vendar je ta izračun zelo občutljiv na numerične napake. Zato bi bilo lažje, če bi iskali prehodno matriko, ki nam osnovno matriko spremeni v zgornje trikotno. Potem je očitno, da bo dobljena matrika imela lastne vrednosti stare matrike po diagonali. Izkaže se, da za vsako matriko A obstaja unitarna matrika U, za katero velja, da je U^∗AU zgornje trikotna. To lastnost opisuje Schurov izrek, poimenovan po ruskem matematiku Issaiku Schuru.

(8)

Izrek 3.1 (Schurov razcep). Naj bodo λ₁, λ₂, . . . , λ_n lastne vrednosti matrike A ∈ C^n×n. Potem obstaja taka unitarna matrikaU ∈C^n×n, da je U^∗AU zgornje trikotna matrika:

U^∗AU =

⎛

⎜

⎝

λ₁ ∗

λ₂ . ..

0 λ_n

⎞

⎟

⎠ .

Dokaz. Pri dokazu si bomo pomagali z indukcijo. Za n = 1 je izrek očiten. Sedaj pa pokažimo še indukcijski korak.

Naj bo x₁ enotski lastni vektor matrike A, ki pripada lastni vrednosti λ₁, torej velja

Ax₁ =λ₁x₁.

Potem si iz množice pravokotnih vektorjev na x₁ izberemo n−1 linearno neodvi- snih vektorjev in jih po Gram-Smitovem postopku preoblikujemo v ortonormirano bazo (y2, y3, . . . , yn). Ta postopek je natančno opisan v Williamovi Fordovi knjigi z naslovom Numerical linear algebra with applications [2, poglavje 14]. Od tod lahko sestavimo unitarno matriko S = (x₁, y₂, . . . , y_n). Torej je

AS = (Ax₁, Ay₂, . . . , Ay_n)

= (λ₁x₁, Ay₂, . . . , Ay_n)

=S(u, S⁻¹Ay₂, . . . , S⁻¹Ay_n), kjer je u= (λ₁,0, . . . ,0)^T. Tako lahko zapišemo

S^∗AS =

(︃λ₁ v 0 B

)︃

,

kjer je v vrstica in B ∈C(n−1)×(n−1). Po indukcijski predpostavki obstaja za B taka unitarna matrika V velikosti (n−1)×(n−1), da je V^∗BV zgornje trikotna. Naj bo

U =S

(︃1 0 0 V

)︃

.

Ker sta V in S unitarni matriki, je tudi matrika U unitarna in U^∗AU je zgornje trikotna z lastnimi vrednostmi λ₁, λ₂, . . . , λ_n na diagonali. □ 3.2. Polarni razcep. Poleg Schurovega razcepa bomo potrebovali tudi polarni razcep. Če si matriko A ∈C^n×n predstavljamo kot linearno transformacijo, jo polarni razcep razdeli na rotacijo in zrcaljenje U, ter na razteg P po ortogonalnih smereh.

Preden dokažemo obstoj polarnega razcepa za vsako matriko A ∈C^n×n, si oglejmo naslednjo lemo.

Dokaz naslednje leme ter dokaz polarnega razcepa smo povzeli po Garrettovi Buffingtonovi skripti z naslovom Polar decomposition of a matrix [1, poglavje 2] in po diplomskem delu Larise Gostenčnik z naslovom Polarni razcep matrik [4, poglavje 3].

Lema 3.2. Za vsako pozitivno semi-definitno matriko P z lastnimi vrednostmi λ₁, λ₂, . . . , λ_n obstaja enolično določena pozitivno semi-definitna matrika B, da velja

B² =P in lastne vrednosti matrike B so enake √

λ1,√

λ2, . . . ,√ λn.

(9)

Dokaz. V naslednjem poglavju med karakterističnimi lastnostmi normalnih matrik dokažemo, da lastni vektorji normalne matrike tvorijo ortonormirano bazo prostora Cⁿ. Ker so pozitivno semi-definitne matrike podmnožica normalnih matrik, tudi lastni vektorjiu₁, u₂, . . . , u_npozitivno semi-definitne matrike P tvorijo ortonormirano bazo prostora C^n×n. Zato lahko preslikavo, ki jo opiše P, zapišemo kot operator, ki bazne vektorje preslika kot P(u_i) = λ_iu_i, kjer je λ_i ustrezna lastna vrednost. Naj operator B preslika bazo kot B(u_i) = √

λ_iu_i za vsak i = 1,2, . . . , n. Torej je √ λ_i lastna vrednost matrike B, poleg tega pa je lahko preveriti, da velja B² = P. Da velja ⟨B(x), x)⟩ ≥0 za vsakx∈Cⁿ, se lahko prepričamo tako, da xrazpišemo kot

x=a₁u₁ +a₂u₂ +· · ·+a_nu_n. Potem je

⟨B(x), x⟩=a²₁√︁

λ₁+a²₂√︁

λ₂+· · ·+a²_n√︁

λ_n ≥0.

Da pokažemo enoličnost, predpostavimo, da obstaja še en operatorC, za katerega velja

C²(x) =P(x) in ⟨C(x), x⟩=⟨x, C(x)⟩ ≥0 za vse x∈Cⁿ.

Naj bo (µ_i, v_i) lastni par preslikave C. Potem velja C²v_i = µ_iCv_i = µ²_iv_i, kar pa pomeni, da je µ²_i lastna vrednost C² = P. Ker so lastne vrednosti matrike P enake λ₁, λ₂, . . . , λ_n in so vse nenegativne, so torej vsiµ_i enaki √

λ_i. Ker tudi lastni vektorji matrike C tvorijo ortonormirano bazo prostora Cⁿ, lahko lastne vektorje matrikeB² =P zapišemo kot linearne kombinacije vektorjev v₁, v₂, . . . , v_n. Za vsak i naj bo

u_i =w_1iv₁+w_2iv₂+· · ·+w_niv_n. Torej je

C²(u_i) = P(u_i) = λ_iu_i =w_1iλ_iv₁+w_2iλ_iv₂+· · ·+w_niλ_iv_n. Po drugi strani pa je

C²(u_i) =C²(w_1iv₁+w_2iv₂+· · ·+w_niv_n) = w_1iλ₁v₁+w_2iλ₂v₂+· · ·+w_niλ_nv_n. Ker so v₁, v₂, . . . , v_n linearno neodvisni, velja w_tiλ_i = w_tiλ_t zat = 1,2, . . . , n. Tako sledi

C(u_i) =C(w_1iv₁ +· · ·+w_niv_n)

=w_1i√︁

λ₁v₁+· · ·+w_ni√︁

λ_nv_n

=w_1i√︁

λ_iv₁+· · ·+w_ni√︁

λ_iv_n

=√︁

λ_iu_i =B(u_i).

Ker u₁, u₂, . . . , u_n sestavljajo bazo prostora Cⁿ, je B =C. □ Sedaj ko smo dokazali, da obstaja dobro definirani koren pozitivno semi-definitne matrike, se lahko lotimo polarnega razcepa.

Izrek 3.3(Polarni razcep). Za vsako matriko A∈C^n×nobstajata enolično določena unitarna matrika U ∈C^n×n in pozitivno semi-definitna matrikaP ∈C^n×n, za kateri velja

A=U P.

Lastne vrednosti matrike P so enake singularnim vrednostim matrike A.

(10)

Dokaz. Če matriko A pomnožimo z njeno hermitsko transponiranko, dobimo hermitsko matriko A^∗A, za katero velja

x^∗A^∗Ax=⟨x, A^∗Ax⟩=⟨Ax, Ax⟩=||Ax||² ≥0 za vsak x∈Cⁿ.

Torej je A^∗A pozitivno semi-definitna. Po prejšnjem izreku obstaja enolično dolo- čena matrika P =√

A^∗A, ki je pozitivno semi-definitna in njene lastne vrednosti so enake korenom lastnih vrednosti matrike A^∗A, torej so po definiciji enake singularnim vrednostim matrike A. Ker je matrika P pozitivno semi-definitna, njeni lastni vektorjiv₁, v₂, . . . , v_n tvorijo ortonormirano bazo prostoraCⁿ. Upoštevamo še, da so lastne vrednosti λ₁, λ₂, . . . , λ_n matrikeP nenegativne. Če lastne vrednosti uredimo po velikosti, velja λ₁, λ₂, . . . , λ_r > 0 in λ_r+1 =λ_r+2 =· · · =λ_n = 0 za neko število r. Definirajmo dve novi matrikiD in C, kot

C= (v₁, v₂, . . . , v_n) in D= (︃ 1

λ1

Av₁, 1 λ2

Av₂, . . . , 1 λr

Av_r, w_r+1, w_r+2. . . , w_n, )︃

, kjer so vektorji w_r+1, w_r+2, . . . , w_n normirani, paroma pravokotni in pravokotni na Av₁, Av₂, . . . , Av_r. Matrika C je unitarna po definiciji, za matriko D pa preverimo, da je unitarna

⟨︃ 1

λ_jAvj, 1 λ_iAvi

⟩︃

= 1

λ_jλ_i⟨vj, A^∗Avi⟩= 1

λ_jλ_i⟨vj, P²vi⟩

= 1

λ_jλ_i⟨v_j, λ²_iv_i⟩= λ_i

λ_j⟨v_j, v_i⟩=

{︄1 i=j

0 i̸=j , za vsak i, j ≤r.

Vektorji w_r+1, w_r+2, . . . , w_n pa matriko D unitarno dopolnjejo, do polnega ranga.

Sedaj lahko definiramo matriko U kot U =DC^∗ =

(︃ 1

λ₁Av1, 1

λ₂Av2, . . . , 1

λ_rAvr, wr+1, wr+2, . . . , wn

)︃

(v1, v2, . . . , vn)^∗, ki je očitno unitarna. Poglejmo sedaj, kam matrika U preslika bazo v₁, v₂, . . . , v_n prostora Cⁿ:

U v_i =DC^∗v_i =D(v₁, v₂, . . . , v_n)^∗v_i =D

⎛

⎜

⎝

⟨v1, vi⟩

⟨v₂, v_i⟩ ...

⟨v_n, v_i⟩

⎞

⎟

⎠

=De_i = 1 λi

Av_i, 1≤i≤r

kjer je e_i = (0, . . . ,0,1,0, . . . ,0) enotski vektor, ki ima enico na i-tem mestu. Za i > r pa velja

U vi =Dei =wi.

Če matriko U pomnožimo z desne s P in si ogledamo, kam matrika U P preslika bazne vektorje v1, v2, . . . , vr, vidimo, da velja

U P v_i =U λ_iv_i =λ_iU v_i = λ_i

λ_iAv_i =Av_i za 1≤i≤r.

Če želimo pokazati, da sta A in U P enaki, moramo še preveriti, kam obe matriki slikata preostale bazne vektorje v_r+1, v_r+2, . . . , v_n:

U P vi =U0vi = 0 za i > r.

(11)

Torej če so vektorji v_i za i > r v jedru matrike A, je dokaz končan. Pa si poglejmo kvadrat norme vektorja Av_i:

∥Av_i∥² =⟨Av_i, Av_i⟩=⟨v_i, A^∗Av_i⟩=⟨v_i, P²v_i⟩=⟨Bv_i, Bv_i⟩=∥Bv_i∥² =∥0v_i∥² = 0,

za i > r. □

Sedaj, ko imamo polarni razcep, lahko pokažemo, da singularne vrednosti matrike Apredstavljajo polosi elipsoida, ki smo ga dobili tako, da smo zApreslikali enotsko sfero.

Naj bodo singularne vrednosti matrike A enake σ₁, σ₂, . . . , σ_n. S polarnim razcepom lahko A zapišemo kot

A=U P,

ker je P pozitivno semi-definitna matrika z lastnimi vrednostmi σ1, σ2, . . . , σn inU unitarna matrika. Ker je matrika P pozitivno semi-definitna, je tudi normalna. V naslednjem poglavju pokažemo, da lahko normalne matrike unitarno diagonaliziramo, torej obstaja unitarna matrika V, da velja

P =V^∗DV,

kjer je D= diag(σ₁, σ₂, . . . , σ_n). Potem lahko zapišemo A=U V^∗DV.

Če sedaj postopoma preslikamo enotsko sfero zA=U V^∗DV, dobimo, daU preslika sfero samo vase, matrika D jo raztegne v elipsoid s polosimi enakim σ₁, σ₂, . . . , σ_n, unitarna matrikaU V^∗ pa elipsoid zavrti in zrcali. Torej singularne vrednosti matrike A res predstavljajo polosi elipsoida.

4. Karakteristične lastnosti normalnih matrik

Cilj tega poglavja je povezati lastnosti normalnih matrik z njihovo osnovno definicijo AA^∗ =A^∗A.

Večino trditev in dokazov smo povzeli po Fuzhen Zangovi knjigi z naslovom Matrix theory [8, poglavje 9].

Izrek 4.1. Naj bo A = (a_ij) n × n kompleksna matrika z lastnimi vrednostmi λ₁, λ₂, . . . , λ_n. Potem so naslednje izjave ekvivalentne.

(1) Matrika A je normalna, torej velja A^∗A=AA^∗.

(2) MatrikoAlahko unitarno diagonaliziramo, kar pomeni, da obstaja takan×n unitarna matrika U, da velja

U^∗AU = diag(λ₁, λ₂, . . . , λ_n).

(3) Obstaja tak polinom p(x), da velja A^∗ =p(A).

(4) Obstaja množica lastnih vektorjev matrike A, ki tvorijo ortonormirano bazo za Cⁿ.

(5) Vsak lastni vektor matrike A je lastni vektor matrike A^∗. (6) Vsak lastni vektor matrike A je lastni vektor matrike A+A^∗. (7) Vsak lastni vektor matrike A je lastni vektor matrike A−A^∗.

(8) Matriko A lahko razpišemo kot A =B +iC za neki hermitski matriki B in C, ki komutirata.

(9) Matriko A lahko razpišemo kot A=∑︁n

i=1λ_iE_i, kjer jeλ_i ∈C in E_i ∈C^n×n, ki zadošča pogojem E_i² =E_i =E_i^∗, E_iE_j = 0 za i̸=j in ∑︁n

i=1E_i =I.

(10) sled(A^∗A) = ∑︁n

i=1|λi|².

(12)

(11) Vse singularne vrednosti matrike A so enake |λ₁|,|λ₂|, . . . ,|λ_n|.

(12) ∑︁n

i=1(Reλ_i)² = ¹₄sled(A+A^∗)². (13) ∑︁n

i=1(Imλ_i)² =−¹₄ sled(A−A^∗)².

(14) Lastne vrednosti matrike A+A^∗ so λ₁+λ₁, λ₂+λ₂, . . . , λ_n+λ_n. (15) Matrika AA^∗−A^∗A je pozitivno semi-definitna.

(16) sled(A^∗A)² = sled((A^∗)²A²).

(17) (A^∗A)² = (A^∗)²A².

(18) ||Ax||=||A^∗x|| za vse x∈Cⁿ.

(19) ⟨Ax, Ay⟩=⟨A^∗x, A^∗y⟩ za vse x, y ∈Cⁿ. (20) A^∗ =AU za neko unitarno matriko U.

(21) A^∗ =V A za neko unitarno matriko V.

(22) U P =P U, če jeA =U P polarni razcep.

(23) AU =U A, če je A=U P polarni razcep.

(24) AP =P A, če je A=U P polarni razcep.

(25) MatrikaA komutira z neko normalno matrikoB, ki ima same različne lastne vrednosti.

Dokaz. V spodnjih diagramih so grafično prikazane vse implikacije, ki jih bomo dokazali v tem dokazu.

(3)

(8) (1) (2) (4)

(9) (7) (5) (6)

(18) (13) (10) (11)

(15) (1) (2) (12)

(17) (16) (19) (14)

(23) (22) (20) (25)

(24) (1) (2) (21)

(1) ⇒ (2): S Schurovim razcepom razcepimo osnovno definicijo normalnosti AA^∗ =A^∗A in dobimo

U^∗T U U^∗T^∗U =U^∗T^∗U U^∗T U,

kjer je U unitarna matrika, matrika T pa je zgornje trikotna. Od tod je preprosto videti, da sta matriki T T^∗ inT^∗T enaki, torej se ujemajo tudi njuni koeficienti. Če

(13)

primerjamo prva elementa v prvi vrstici matrik T^∗T inT T^∗, dobimo zvezo

|t₁₁|² =|t₁₁|²+

n

∑︂

j=2

|t_1j|².

Od tod sledi, da je t1j = 0 vse j = 2,3, . . . , n. Sedaj pa si poglejmo drugi element v drugi vrstici matrik T^∗T inT T^∗:

|t₁₂|²+|t₂₂|² =|t₂₂|²+

n

∑︂

j=3

|t_2j|²

Ker jet₁₂= 0, jet_2j = 0za vsej = 3,4, . . . , n. Ta postopek induktivno nadaljujemo.

Opazimo, da je t_ij = 0 za vse i̸=j. Torej je T diagonalna matrika.

(2) ⇒ (1): Po predpostavki je A = U^∗T U, kjer je U unitarna in T diagonalna, torej komutira s svojo hermitsko transponiranko. Zato lahko produkt matrik A in A^∗ zapišemo kot

AA^∗ =U^∗T U(U^∗T U)^∗ =U^∗T U U^∗T^∗U =U^∗T T^∗U

=U^∗T^∗T U =U^∗T^∗IT U =U^∗T^∗U U^∗T U

= (U^∗T U)^∗U^∗T U =A^∗A.

(2) ⇒(3): Naj bo L ={λ₁, λ₂, . . . , λ_m} množica različnih lastnih vrednosti matrike A. Moč množice L je enaka m ≤ n. Z Lagrangeevo interpolacijo poiščemo polinom p stopnje m−1:

p(x) =

m

∑︂

i=1

(︃

∏︂

1≤j≤m j̸=i

x−λ_j λ_i−λ_j

)︃

λ_i,

Kako najti Lagrangeev interpolacijski polinom je Marjeta Krajnc, opisala v zbirki nalog z rešitvami z naslovom Numerična aproksimacija in interpolacija [7, poglavje 5].

Za interpolacijski polinom velja:

p(λ_i) =λ_i za vsak i= 1,2, . . . , m.

Po predpostavki je A = U^∗diag(λ₁, . . . , λ_n)U za neko unitarno matriko U, zato velja:

A^∗ =U^∗diag(λ₁, . . . , λ_n)U

=U^∗diag(p(λ₁), . . . , p(λ_n))U

=U^∗p(diag(λ1, . . . , λn))U

=p(U^∗diag(λ₁, . . . , λ_n)U)

=p(A).

(3) ⇒(1): Očitno velja

A^∗A=p(A)A=Ap(A) = AA^∗.

(2) ⇒(4): Če razcep A=Udiag(λ₁, . . . , λ_n)U^∗ pomnožimo z U z desne, dobimo AU =Udiag(λ1, λ2, . . . , λn)

ali

Aui =λiui za i= 1,2, . . . , n,

(14)

kjeru_ipredstavljai-ti stolpec matrikeU, torej jeu_ipo definiciji lastni vektor matrike A. Ker pa je U unitarna matrika, njeni stolpci tvorijo ortonormirano bazo prostora Cⁿ. Torej lastni vektorji matrike A tvorijo ortonormirano bazo prostoraCⁿ.

(4) ⇒ (2): Naj lastni vektorji u₁, u₂, . . . , u_n matrike A tvorijo ortonormirano bazo prostora Cⁿ. Če matrikoU sestavimo iz lastnih vektorjevu₁, u₂, . . . , u_n, kot je opisano spodaj

U = (u₁, u₂, . . . , u_n),

je očitno, da je matrika U unitarna. Sedaj pa si oglejmo, kaj dobimo, če zmnožimo U inA,

AU = (λ₁u₁, λ₂u₂, . . . , λ_nu_n) = Udiag(λ₁, λ₂, . . . , λ_n).

Enačbo pomnožimo z U^∗ iz leve in dobimo U^∗AU = diag(λ₁, λ₂, . . . , λ_n). Torej se da matriko A unitarno diagonalizirati.

(2) ⇒ (5): Za matriko A velja zveza U^∗AU = diag(λ1, λ2, . . . , λn), kjer so λ1, λ2, . . . , λn njene lastne vrednosti. Če zvezo pomnožimo zU z leve, dobimo

AU =Udiag(λ₁, λ₂, . . . , λ_n), kar pa je enako

A(u₁, u₂, . . . , u_n) = (λ₁u₁, λ₂u₂, . . . , λ_nu_n), kjer so u₁, u₂, . . . , u_n stolpci matrikeU. Ali zapisano drugače

Au_i =λ_iu_i za i= 1,2, . . . , n.

Torej so stolpci matrikeU lastni vektorjiA. Če enačboAU =Udiag(λ₁, λ₂, . . . , λ_n) hermitsko transponiramo in pomnožimo z U z leve in desne, dobimo

A^∗U =Udiag(λ₁, λ₂, . . . , λ_n).

Od tod po enakem postopku kot zgoraj izračunamo, da so stolpci matrike U lastni vektorji matrike A.

(5) ⇒(2): Najprej se prepričajmo, da velja naslednja ekvivalenca:

Ax=λx⇔(U^∗AU)(U^∗x) = λ(U^∗x).

Tega ni težko dokazati: med A in x vrinemo I =U U^∗, ter z leve pomnožimo z U^∗ in dobimo želeno ekvivalenco.

Sedaj s Schurovim razcepom spremenimo A v zgornje trikotno in novo matriko označimo z Aˆ =U^∗AU. Očitno je, da jee1 = (1,0, . . . ,0)^T lastni vektorAˆ. Matrika Aˆ je še vedno normalna, ker velja

Aˆ^∗Aˆ =U^∗A^∗U U^∗AU =U^∗A^∗AU =U^∗AA^∗U =U^∗AU U^∗A^∗U =AˆAˆ^∗.

Torej je vektor e₁ tudi lastni vektor Aˆ^∗, ki je spodnje trikotna. Iz definicije Aˆ^∗e₁ = λ₁e₁ za lastni vektor matrike Aˆ^∗ vidimo, da ima prvi stolpec matrike Aˆ^∗ povsod ničle razen na prvem mestu. Torej velja:

Aˆ =

(︃λ₁ 0 0 B

)︃

in Aˆ^∗ =

(︃λ₁ 0 0 B^∗

)︃

.

Matrika B je tudi normalna in zgornje trikotna, kar pomeni, da lahko postopek induktivno nadaljujemo na B, dokler ne dobimo, da je

Aˆ =U^∗AU =

⎛

⎜

⎝ λ1

λ₂ . ..

λ_n

⎞

⎟

⎠ ,

(15)

kar pa smo hoteli dokazati.

(5) ⇒ (6): Naj bo λ lastna vrednost matrike A, potem je λ lastna vrednost matrike A^∗. Zato lahko zapišemo:

(A+A^∗)u=Au+A^∗u=λu+λu = (λ+λ)u.

Torej jeulastni vektor matrikeA+A^∗ in(λ+λ)njemu pripadajoča lastna vrednost.

(6) ⇒(5): Naj bo (A+A^∗)u=λu in Au=µu zau̸= 0. Potem:

A^∗u=λu−Au= (λ−µ)u.

Torej je u lastni vektor matrikeA^∗.

(5) ⇔(7): Se dokaže podobno kot ekvivalenca (5)⇔(6).

(8) ⇒(1): Naj za normalno matrikoAveljaA=B+iC, kjer staBinChermitski matriki, za kateri velja BC =CB. Potem samo razpišemo A^∗A in dobimo

A^∗A= (B^∗−iC^∗)(B +iC) = (B −iC)(B+iC)

=B²+C² = (B+iC)(B −iC) = (B+iC)(B+iC)^∗ =AA^∗. (1) ⇒(8): Naj bosta B = ^A+A₂ ^∗ inC = ^A−A_2i ^∗. Preprosto je opaziti, da velja:

B^∗ =

(︃A+A^∗ 2

)︃∗

= A+A^∗ 2 =B in

C^∗ =

(︃A−A^∗ 2i

)︃^∗

= A−A^∗ 2i =C.

Da dokažemo, da B in C komutirata, samo razpišemo BC kot BC = (A+A^∗)(A−A^∗)

4i = A²−(A^∗)²

4i = (A−A^∗)(A+A^∗)

4i =CB.

(9) ⇒ (1): Izraz A = ∑︁n

i=1λ_iE_i vstavimo v osnovno definicijo normalnosti in upoštevamo, da je EiEj = 0 za i̸=j

AA^∗ =

n

∑︂

i=1

λiEi n

∑︂

i=1

λiE_i^∗ =

n

∑︂

i=1

|λi|²EiE_i^∗

=

n

∑︂

i=1

|λ_i|²E_i^∗E_i =

n

∑︂

i=1

λ_iE_i^∗

n

∑︂

i=1

λ_iE_i =A^∗A.

(2) ⇒(9): Če označimo stolpce unitarne matrike U z u₁, u₂, . . . , u_n, potem lahko A=Udiag(λ₁, λ₂, . . . , λ_n)U^∗ razpišemo kot

A=Udiag(λ₁, λ₂, . . . , λ_n)U^∗ =λ₁u₁u^∗₁+λ₂u₂u^∗₂ +· · ·+λ_nu_nu^∗_n.

Naj boEi =uiu^∗_i zai= 1, . . . , n. Preveriti moramo, aliEi izpolnjuje pogoje devete trditve:

E_i^∗ = (u_iu^∗_i)^∗ =u_iu^∗_i =E_i.

Matriki E_i inE_j razpišemo in zmnožimo drugi in tretji faktor E_iE_j =u_iu^∗_iu_ju^∗_j = 0, če jei̸=j

EiEi =uiu^∗_iuiu^∗_i =uiu^∗_i =Ei, če je i=j.

(16)

Diagonalni elementi vsote matrik E_i se seštejejo v ena, elementi izven diagonal pa v nič, ker je U unitarna matrika

n

∑︂

i=1

E_i =

n

∑︂

i=1

⎛

⎜

⎝

|u1,i|² u1,iu2,i . . . u1,iun,i

u_2,iu_1,i |u_2,i|² . . . u_2,iu_n,i ... ... . .. ... u_n,iu_1,n u_n,iu_2,i . . . |u_n,i|²

⎞

⎟

⎠

=

⎛

⎜

⎝

∥u₁∥² ⟨u₁, u₂⟩ . . . ⟨u₁, u_n⟩

⟨u₂, u₁⟩ ∥u₂∥² . . . ⟨u₂, u_n⟩ ... ... . .. ...

⟨u_n, u₁⟩ ⟨u_n, u₂⟩ . . . ∥u_n∥²

⎞

⎟

⎠

=I.

(2) ⇒(10): Naj boU unitarna in Ddiagonalna matrika iz druge trditve. Potem lahko zapišemo:

sled(A^∗A) = sled(U^∗D^∗U U^∗DU) = sled(U^∗D^∗DU) = sled(D^∗D) =

n

∑︂

i=1

|λ_i|². (10) ⇒ (2): Matriko A razcepimo s Schurovim razcepom in dobimo A = U^∗T U, kjer je U unitarna, matrika T pa zgornje trikotna, torej dobimo

n

∑︂

i=1

|λ_i|² = sled(A^∗A) = sled(U^∗T^∗U U^∗T U) = sled(T^∗T) =

n

∑︂

i=1

|λ_i|²+∑︂

i<j

|t_ij|². To pa pomeni, da so vsi nediagonalni elementi matrike T enaki nič.

(11)⇒(10): Ker je sled matrikeA enaka vsoti njenih lastnih vrednosti, velja:

sled(A^∗A) = λ₁(A^∗A) +· · ·+λ_n(A^∗A)

=σ²₁+σ₂²+· · ·+σ²_n

=|λ₁|²+|λ₂|²+· · ·+|λ_n|².

(2) ⇒(11): Produkt matrik A inA^∗ razcepimo po drugi trditvi in dobimo A^∗A =U^∗D^∗DU.

Od tod je očitno, da so lastne vrednosti matrike A^∗A enake |λ1|²,|λ2|², . . . ,|λn|², kar pa pomeni, da so singularne vrednosti A enake |λ₁|,|λ₂|, . . . ,|λ_n|.

(12) ⇒ (10): Lahko predpostavimo, da je A zgornje trikotna, ker za vsako unitarno matriko U veljasled(A) = sled(U^∗AU). Torej lahko sled(A)in sled(A^∗) zapi- šemo kot vsoto njunih lastnih vrednosti

sled(A) =

n

∑︂

i=1

λ_i in sled(A^∗) =

n

∑︂

i=1

λ_i,

kjer so λ₁, λ₂, . . . , λ_n lastne vrednosti matrike A. Poleg tega pa velja tudi

sled(A^∗+A)² = sled(A²+AA^∗+A^∗A+ (A^∗)²) = sled(A)²+ 2 sled(A^∗A) + sled(A^∗)². Od tod sledi

sled(A^∗A) = 1 2

(︁sled(A+A^∗)²−sledA²−sled(A^∗)²)︁

.

(17)

Če identiteto Reλi = ^λⁱ^+λ₂ ⁱ vstavimo v začetno enačbo, dobimo enakost

n

∑︂

i=1

(Reλ_i)² =

n

∑︂

i=1

(λ_i+λ_i)²

4 = 1

4sled(A+A^∗)².

Ker so lastne vrednosti matrikeA² enakeλ²_i in lastne vrednosti matrike(A^∗)² enake λ_i², velja

sled(A^∗A) = 1 2

(︁sled(A+A^∗)²−sledA² −sled(A^∗)²)︁

= 1 2

(︄ _n

∑︂

i=1

(λ_i+λ_i)²−

n

∑︂

i=1

λ²_i −

n

∑︂

i=0

λ_i² )︄

=

n

∑︂

i=0

|λ_i|². (2) ⇒(12): Ker je A=U^∗DU, je

sled(A+A^∗)² = sled(U^∗DU + (U^∗DU)^∗)² = sled(U^∗(D+D^∗)U)²

= sled(D+D^∗)² =

n

∑︂

i=1

(λ_i+λ_i)² =

n

∑︂

i=1

(2 Reλ_i)². (2) ⇒(13): Izraz sled(A−A^∗)² podobno razpišemo kot zgoraj in dobimo

sled(A−A^∗)² =

n

∑︂

i=1

(λ_i−λ_i)² =

n

∑︂

i=1

(2iImλ_i)² =−4

n

∑︂

i=1

(Imλ_i)².

(13)⇒(10): V izrazusled(A−A^∗)² predpostavimo, da jeA zgornje trikotna. To lahko naredimo, ker bo enakost še vedno veljala, če A zamenjamo z U^∗AU, kjer je U unitarna matrika. Potem lahko podobno kot v dokazu implikacije (12) ⇒ (10) izračunamo

sled(A^∗A) =−1 2

(︁sled(A−A^∗)²−sledA²−sled(A^∗)²)︁

= 1 2

(︄

−4

n

∑︂

i=1

(Imλi)²−

n

∑︂

i=1

λ²_i −

n

∑︂

i=1

λi 2

)︄

= 1 2

(︄ _n

∑︂

i=1

(λ_i−λ_i)²−

n

∑︂

i=1

λ²_i −

n

∑︂

i=1

λ_i² )︄

=

n

∑︂

n=1

|λ_i|².

(14)⇒(12): Na več načinov lahko opazimo, da če jeλlastna vrednost matrikeA, je λ² lastna vrednost matrike A². Najpreprostejše je, da pogledamo, kam A² slika pripadajoči lastni vektor v matrikeA:

A²v =A(λv) = λAv=λ²v.

Sedaj pa se lahko lotimo dokazovanja implikacije. Torej če so λ₁ + λ₁, λ₂ + λ₂, . . . , λ_n +λ_n lastne vrednosti matrike A+A^∗, so potem tudi njihovi kvadrati lastne vrednosti matrike (A+A^∗)². Tako velja

sled(A+A^∗)² =

n

∑︂

i=1

(λ_i+λ_i)² =

n

∑︂

i=1

(2 Reλ_i)² = 4

n

∑︂

i=1

(Reλ_i)².

(2) ⇒(14): Dokaz v to smer je preprost. Samo razpišemoAkot A=U^∗DU, kjer je U unitarna matrika inD diagonalna matrika, in dobimo

A+A^∗ =U^∗DU +U^∗D^∗U =U^∗(D+D^∗)U,

(18)

kar pa je diagonalizacija matrikeA+A^∗, torej so diagonalni elementi matrikeD+D^∗ lastne vrednosti matrike A+A^∗.

(1) ⇔ (15): V desno stran je očitno. Leva implikacija pa je kombinacija dveh lastnosti sledi. Prva je

sled (XY −Y X) = 0,

kar velja za vse kvadratne matrikeX inY enakih velikosti. Druga lastnost pa pravi, da če je matrika P pozitivno semi-definitna, za njo velja

sledP = 0⇔P = 0.

Torej je

sled (AA^∗−A^∗A) = 0, kar pomeni, da je AA^∗ =A^∗A.

Prva lastnost je očitna, druga pa je očitna samo v levo stran. Za dokaz v drugo stran upoštevajmo, da so vse lastne vrednosti pozitivno semi-definitne matrike nenegativne in da je sled matrike enaka vsoti njenih lastnih vrednosti

sledP =

n

∑︂

i=1

λ_i(P)≥ (︄ _n

∑︂

i=1

(λ_i(P))² )︄1/2

.

Ker so pozitivno semi-definitne matrike tudi normalne, so lastne vrednosti enake singularnim vrednostim, torej dobimo

sledP ≥ (︄ _n

∑︂

i=1

(λ_i(P))² )︄1/2

= (︄ _n

∑︂

i=1

(σ_i(P))² )︄1/2

=∥P∥_F = (︄ _n

∑︂

i,j=1

|p_ij|² )︄1/2

. To pomeni, da velja

0 = sledP ≥ (︄ _n

∑︂

i,j=1

|p_ij|² )︄1/2

, od koder sledi

sledP = 0⇒P = 0.

(1) ⇒(16): Ker je A^∗A=AA^∗, je

sled(A^∗A)² = sled(A^∗AA^∗A) = sled((A^∗)²A²).

(16) ⇒ (1): Za dokaz v drugo smer upoštevajmo, da za kvadratne matrike X in Y enakih velikosti velja

sled(XY) = sled(Y X) in sled(X^∗X) =∥X∥²_F = 0⇔X = 0.

Sedaj izračunajmo sled matrike (A^∗A− AA^∗)^∗(A^∗A −AA^∗) = (A^∗A−AA^∗)² in dobimo

sled(A^∗A−AA^∗)² = sled(A^∗A)²−sled((A^∗)²A²)−sled(A²(A^∗)²) + sled(AA^∗)². Po predpostavki se odšteje prvi in drugi del ter tretji in četrti del. Tako dobimo, da je sled((A^∗A−AA^∗)^∗(A^∗A−AA^∗)) = 0, kar pa pomeni da je A^∗A−AA^∗ = 0.

(16)⇔(17): Samo uporabimo ekvivalencosled(A^∗A) = 0⇔A= 0.

(1) ⇒(18): Samo razpišemo∥Ax∥² kot

∥Ax∥² =⟨Ax, Ax⟩=⟨x, A^∗Ax⟩=⟨x, AA^∗x⟩=⟨A^∗x, A^∗x⟩=∥A^∗x∥².

(18)⇒(1): Dokaz te implikacije smo našli v Simonovi Foucartovi skripti [3, dokaz 2].

(19)

V to stran uporabimo dve lastnosti kompleksnih števil. Prva je, da za vsakz ∈C obstaja tak λ ∈ C, da velja |λ| = 1 in ℜ(λz) = |z|. Od tod dobimo, da za vsaka x, y ∈Cⁿ obstaja λ∈Cdolžine ena, da velja

ℜ(λ⟨x,(A^∗A−AA^∗)y⟩) =|⟨x,(A^∗A−AA^∗)y⟩|.

Druga pa, da za vsaka x, y ∈Cⁿ velja

∥x+y∥² =⟨x+y, x+y⟩=∥x∥²+∥y∥²+⟨x, y⟩+⟨y, x⟩

=∥x∥² +∥y∥²+⟨x, y⟩+⟨x, y⟩=∥x∥²+∥y∥²+ 2ℜ(⟨x, y⟩) Sedaj razpišemo obe strani enačbe ∥A(λx+y)∥² =∥A^∗(λx+y)∥² in dobimo

∥Ax∥² +∥Ay∥² + 2ℜ(λ⟨Ax, Ay⟩) = ∥A^∗x∥²+∥A^∗y∥²+ 2ℜ(λ⟨A^∗x, A^∗y⟩) Ker velja ∥Ax∥² =∥A^∗x∥² in∥Ay∥² =∥A^∗y∥², dobimo

0 = ℜ(λ⟨Ax, Ay⟩ −λ⟨A^∗x, A^∗y⟩) =ℜ(λ⟨x, A^∗Ay⟩ −λ⟨x, AA^∗y⟩)

=ℜ(λ⟨x,(A^∗A−AA^∗)y⟩) = |⟨x,(A^∗A−AA^∗)y⟩|.

Ker je to res za vsak x∈Cⁿ lahko sklepamo, da je(A^∗A−AA^∗)y = 0, kar pa drži za vsak y∈Cⁿ, to pa pomeni da je A^∗A−AA^∗ = 0.

(19)⇔(1): Opazimo, da veljata naslednji ekvivalenci

A^∗A =AA^∗ ⇔ ⟨A^∗Ax, y⟩=⟨AA^∗x, y⟩ ⇔ ⟨Ax, Ay⟩=⟨A^∗x, A^∗y⟩, za vse x, y ∈Cⁿ.

(20)⇒(1): Naj boA^∗ =AU za neko unitarno matriko U, potem velja A^∗A=A^∗(A^∗)^∗ = (AU)(AU)^∗ =AA^∗.

(2) ⇒ (20): Naj bo A = V^∗diag(λ₁, λ₂, . . . , λ_n)V, kjer je V unitarna matrika.

Za U vzemimo U =V^∗diag(l₁, l₂, . . . , l_n)V, kjer je l_i = ^λ_λⁱ

i, če je λ_i ̸= 0, drugače je l_i = 1. Potem velja

A^∗ =V^∗diag(λ₁, λ₂, . . . , λ_n)V

=V^∗diag(λ₁, λ₂, . . . , λ_n)V V^∗diag(l₁, l₂, . . . , l_n)V

=AU.

(2) ⇔(21): Dokaz je zelo podoben kot pri dvajseti trditvi.

(1) ⇔ (22): Naj bo A = U P polarni razcep A, torej je matrika U unitarna in P pozitivno semi-definitna. Iz osnovne zveze za normalnost matrike A^∗A = AA^∗ dobimo

P^∗P =U P P^∗U^∗, oziroma

P² =U P²U^∗ =U P P U^∗ =U P U^∗U P U^∗ = (U P U^∗)².

Zaradi enoličnosti v lemi 3.2je zgornja enakost ekvivalentna naslednji enakosti P =U P U^∗,

kar pa nam da

P U =U P.

Torej je ekvivalenca dokazana.

(22)⇒(23): Če matrikoA pomnožimo z U, kjer jeU unitarna matrika iz polarnega razcepa matrike A, dobimo

AU =U P U =U U P =U A.