行列の平方根

提供: testwiki
ナビゲーションに移動 検索に移動

テンプレート:Pathnav 数学のおもに線型代数学および函数解析学における行列の平方根(ぎょうれつのへいほうこん、テンプレート:Lang-en-short)は、数に対する通常の平方根の概念を行列に対して拡張するものである。すなわち、行列 テンプレート:Mvar が行列 テンプレート:Mvar平方根であるとは、行列の積に関して テンプレート:Mathテンプレート:Mvar に等しいときに言う。

「実数の平方根は必ずしも実数にならないが、複素数は必ず複素数の範囲で平方根を持つ」ことに対応する事実として、実行列の平方根は(存在しても)必ずしも実行列にならないが、複素行列が平方根を持てばそれは必ず複素行列の範囲で取れる。

平方根を持たない行列も存在するテンプレート:Efn2

また一般に、ひとつの行列が複数の平方根を持ち得るテンプレート:Efn2。実際、テンプレート:Math 単位行列は次のように無数の平方根を持つ。[1bcbc1bc],[1bcbc1bc],[1001],[1001]

このように行列の平方根は無数に存在しうるが、半正定値行列テンプレート:Efn2の範疇で行列の主平方根 (principal square root) の概念が定義できて「半正定値行列の主平方根はただ一つ」である(これは「非負実数が非負の平方根(主平方根)をただ一つだけ持つ」という事実に対応する)。

テンプレート:Math 行列が、相異なる二つの非零固有値を持つならば、それは四つの平方根を持つ(より一般に、相異なる テンプレート:Mvar 個の非零固有値を持つ テンプレート:Mvar 行列は テンプレート:Math 個の平方根を持つ)。実際に、そのような仮定を満たす行列 テンプレート:Mvarテンプレート:Mvar の固有ベクトルを列ベクトルに持つ行列 テンプレート:Mvar とそれに対応する固有値を対角成分に持つ対角行列 テンプレート:Mvar を用いて テンプレート:Math固有値分解できるから、テンプレート:Mvar の平方根は テンプレート:Math で与えられることがわかる。ただし、テンプレート:Mathテンプレート:Mvar の任意の平方根で、それは テンプレート:Mvar の対角成分の任意の平方根を同じ位置の対角成分として持つ対角行列であり、その選び方は テンプレート:Math 通りある。同じ理由で、上で述べた「半正定値行列の主平方根がただ一つに定まる」ことも言える—半正定値行列テンプレート:Efn2 テンプレート:Mvar の全ての非負固有値の主平方根を対角成分に持つ対角行列を テンプレート:Math とする行列 テンプレート:Math はただ一つしかない。

適当な冪零行列 テンプレート:Mvar を用いて テンプレート:Math の形に書ける行列の平方根 テンプレート:Math は、二項級数に対する汎函数計算で求められる。同様に、行列の指数函数 テンプレート:Math, 対数函数 テンプレート:Math が既知ならば、 テンプレート:Mathテンプレート:Mvar の(主)平方根とすることができる(収束性に注意せよ)。

定義

定義 (行列の平方根)
行列 テンプレート:Mvar が行列 テンプレート:Mvar平方根であるとは、テンプレート:Math を満たすときに言う[1]テンプレート:Efn2
定義 (行列の主平方根)

「非負実数が非負の平方根(主平方根)をただ一つだけ持つ」という事実に対応して

命題

  1. 半正定値行列は、それ自身が半正定値となるような平方根をただ一つ持つ。
  2. 一般に、すべての固有値が正の実数となる複素行列はすべての固有値が正の実数となる平方根をただ一つ持つ。
が成り立つ。そのように定まるただ一つの (the, unique) 平方根は主平方根 (principal square root) と呼ばれる。

主平方根をとる操作は行列全体の成す集合上で連続である[2]。このとき、考えている行列が実行列ならば、その主平方根もまた実行列になる。主平方根に関する性質は、行列に対するテンプレート:Ill2の帰結として得られる[3][4]。あるいは主平方根の存在と一意性はジョルダン標準形を用いて直截に示せる(後述)。

注意
記号 テンプレート:Mathテンプレート:Math は、主平方根を表すために用いる場合[5]や、平方根の任意の一つを表すために用いる場合などがあるので、文脈に注意すべきである。

計算法

明示公式

テンプレート:Math 行列の場合は、すべての成分を明示的に計算することによって平方根を求めることはそう難しくない。固有値が退化していない場合の平方根はテンプレート:Ill2として記述できる。

すなわち、A=[abcd]とし、その行列式をΔ=adbc
特性方程式(xa)(xd)bc=x2(a+d)x+adbc=0の判別式を
δ=(a+d)24(adbc)=(a+d+2Δ)(a+d2Δ)としたとき、

δ0ならば、 Aの平方根は、

1a+d+2Δ(A+ΔI)1a+d+2Δ(A+ΔI)1a+d2Δ(AΔI)1a+d2Δ(AΔI)と明示的に表記できる。

平方根となることは、実際に2乗を計算すれば(A+ΔI)2=A2+ΔI+2ΔA=(a+d+2Δ)Aから容易にわかる。

あるいは、2次のケイリー・ハミルトンの定理A2(a+d)A+ΔI=0から(a+d)A=A2+ΔI(a+d+2Δ)A=A2+2ΔA+ΔI=(A+ΔI)2としても良い。

これら以外に平方根が存在しないことについては、B2=Aとした場合、δ0よりAは2つの相異なる固有値λ1λ2と、独立な固有ベクトルAv1=λ1v1Av2=λ2v2を持つが、任意の2次列ベクトルは、v1v2の1次結合で表せるので、Bv1=α11v1+α12v2Bv2=α21v1+α22v2とすると、 λ1v1=Av1=BBv1=B(α11v1+α12v2)=(α112+α12α21)v1+(α11α12+α12α22)v2λ2v2=Av2=BBv2=B(α21v1+α22v2)=(α21α11+α22α21)v1+(α21α12+α222)v2すなわち、 [λ100λ2]=[α11α12α21α22][α11α12α21α22]=[α112+α12α21α12(α11+α22)α21(α11+α22)α222+α12α21]であるが、 λ1λ2のため、解はα11=±λ1α12=α21=0α22=±λ2に定まる。これにより任意の2次列ベクトルxv1+yv2Bによりどう変換されるかが定まるが、これはBが定まることを意味する。Aが固有値ゼロを持たない場合は解が4組、固有値ゼロを持つ場合(Δ=0の場合)は解が2組であるが、これは上記の明示公式で尽くされているので、これら以外には、平方根は存在しない。

δ=0の場合は、複雑になる。
δ=0かつAの最小多項式が1次の場合

A=aIとなるため、次のように無数の平方根を持つ
[axyxyaxy],[axyxyaxy],[a00a],[a00a]

δ=0かつAの最小多項式が2次でΔ0の場合

(a+d+2Δ)(a+d2Δ)のうちどちらかはゼロではなく、ゼロではない方を使って次のように表せる。
1a+d+2Δ(A+ΔI)1a+d+2Δ(A+ΔI)または
1a+d2Δ(AΔI)1a+d2Δ(AΔI)
平方根が2つしかないことは、次のように言える。
B2=Aとした場合、δ=0よりAは重根の固有値λを持ち、最小多項式φ(t)=(tλ)2が2次のため、(AλI)v1=v20(AλI)v2=(AλI)2v1=0とできるが、任意の2次列ベクトルは、v1v2の1次結合で表せるので、Bv1=α11v1+α12v2Bv2=α21v1+α22v2とすると、
λv1+v2=Av1=BBv1=B(α11v1+α12v2)=(α112+α12α21)v1+(α11α12+α12α22)v2
λv2=Av2=BBv2=B(α21v1+α22v2)=(α21α11+α22α21)v1+(α21α12+α222)v2すなわち、
[λ10λ]=[α11α12α21α22][α11α12α21α22]=[α112+α12α21α12(α11+α22)α21(α11+α22)α222+α12α21]であるが、
解はα11=±λα21=0α12=1/(2α11)α22=α11に定まる。これにより任意の2次列ベクトルxv1+yv2Bによりどう変換されるかが定まるが、これはBが定まることを意味する。解は2組であるが、これは上記の明示公式で尽くされているので、これら以外には、平方根は存在しない。

δ=0かつAの最小多項式が2次でΔ=0の場合

この場合、行列は平方根を持たない。
上記と同様の議論で、B2=Aとした場合、δ=0よりAは重根の固有値ゼロを持ち、最小多項式φ(t)=t2が2次のため、Av1=v20Av2=A2v1=0とできるが、任意の2次列ベクトルは、v1v2の1次結合で表せるので、Bv1=α11v1+α12v2Bv2=α21v1+α22v2とすると、
v2=Av1=BBv1=B(α11v1+α12v2)=(α112+α12α21)v1+(α11α12+α12α22)v2
0=Av2=BBv2=B(α21v1+α22v2)=(α21α11+α22α21)v1+(α21α12+α222)v2すなわち、
[0100]=[α11α12α21α22][α11α12α21α22]=[α112+α12α21α12(α11+α22)α21(α11+α22)α222+α12α21]であるが、
これは解を持たない。

テンプレート:Mvarテンプレート:Math 対角行列ならば、テンプレート:Mvar の対角成分の任意の平方根を対応する位置の対角成分に持つ対角行列 テンプレート:Mvar を作れば平方根が得られる。テンプレート:Mvar の対角成分が非負の実数ならば、先の対角行列 テンプレート:Mvar で各成分の符号を全て正としたものは テンプレート:Mvar の主平方根である。

冪等行列の平方根は、自身を平方根に持つ。

対角化の利用

対角化可能行列 テンプレート:Mvar に対し、適当な行列 テンプレート:Mvar と対角行列 テンプレート:Mvar が存在して テンプレート:Math と書ける。これは テンプレート:Mvarテンプレート:Math を張る テンプレート:Mvar 個の固有値を持つことと同値である。このとき テンプレート:Mvar はその列ベクトルが テンプレート:Mvar 個の固有ベクトルであるように選べる。そうして テンプレート:Mvar の平方根は テンプレート:Mvar の任意の平方根を用いて A1/2=VD1/2V1 と書ける。実際、(VD1/2V1)2=VD1/2(V1V)D1/2V1=VDV1=A である。 テンプレート:Mvar がエルミート行列ならば対角化に用いる行列 テンプレート:Mvar は固有ベクトルを適当に選んでユニタリ行列となるようにとれる。この場合、テンプレート:Mvar の逆行列はたんに随伴をとるだけであるから、A1/2=VD1/2V と書ける。

ジョルダン分解の利用

正方行列 Aジョルダン標準形J=P1APとすると、次が言える。

KJの平方根K2=Jとすると、B=PKP1は、B2=(PKP1)(PKP1)=PK2P1=PJP1=Aより、Aの平方根となる。
逆にBAの平方根B2=Aとすると、K=P1BPは、K2=(P1BP)(P1BP)=P1B2P=P1AP=Jより、Jの平方根であり、B=PKP1である。

このため、ジョルダン標準形J=P1APの全ての平方根Kを知ることができれば、B=PKP1により、Aの全ての平方根Bを知ることができる。

J=[J100Jm]とし、Ki2=Ji,1imとすれば、K=[K100Km]は、Jの平方根のうちの一つである。

逆に、J=[J1OOJ2]、ただしJ1,J2はジョルダン標準形で、J1J2は共通の固有値を持たないとすると、Jの平方根は、K=[K1OOK2]ただし、K12=J1,K22=J2に限られる。

これは、K=[K1BCK2],J=K2とすると、

K3=KJ=[K1BCK2][J1OOJ2]=[K1J1BJ2CJ1K2J2]=JK=[J1OOJ2][K1BCK2]=[J1K1J1BJ2CJ2K2]より

BJ2=J1Bとなるが、B=[b1bk]J2の対角成分(固有値)をλi,1ikと置き、第1列に注目すれば、λ1b1=J1b1だが、J1J2は共通の固有値を持たないため、b1=0が言え、順次、第2列、第3列に注目すればbi=0が言え、B=Oが言える。

CJ1=J2Cからも同様に、C=[c1ck]と置き、第k行に注目すればckJ1=λkckだが、J1J2は共通の固有値を持たないため、ck=0が言え、順次、第k-1行、第k-2行に注目すればci=0が言え、C=Oが言える。このため、上記が言える。

ジョルダン標準形の平方根には、ジョルダン細胞の平方根であるものと、

[1001]=[1bcbc1bc]2

のようにジョルダン細胞の平方根ではないもの(同じ固有値のジョルダン細胞が複数あるときに発生する)があるので、注意が必要である。

ジョルダン細胞の平方根

ジョルダン細胞Jn(λ)とはテンプレート:Mvar次正方行列で、j<iのときJn(λ)ij=0Jn(λ)ii=λJn(λ)ii+1=1j>i+1のときJn(λ)ij=0となるものを言う。

λ0のとき、ジョルダン細胞Jn(λ)の平方根は、下記の行列KおよびKである。

j<iのときKij=0Kii=λj>iのときKij=(1)ji1(2j2i2)!22j2i1(ji1)!λ(2j2i1)/2

λ=0のとき、ジョルダン細胞Jn(0)は、

n=1の場合、平方根0を持つ
n>1の場合、平方根を持たない

J2(0)=[0100]は平方根を持たない。

λ0のとき、ジョルダン細胞Jn(λ)の平方根が2つしかないことは、次から言える。 K2=Jn(λ)となる行列が存在したとし、K3の成分を考える。

Kij3=(Jn(λ)K)ij={λKi1+Ki+1j(1in1)λKnj(i=n)
Kij3=(KJn(λ))ij={λKi1(j=1)λKij+Kij1(2jn)

Knj3,2jnを比較すると、λKnj=λKnj+Knj1,2jnこのためKnj=0,1jn1

Kij3,1in1,2jnを比較すると、λKij+Ki+1j=λKij+Kij1,1in1,2jnこのためKi+1j+1=Kij,1in1,1jn1

このため、Kは上三角行列で、斜めに同じ値が並ばなければならない。K2=Jn(λ)(n,n)成分を比較することにより、Knn2=λ,Knn=±λが言え、以下(j,n)成分j=n1,n2,,1を比較することにより、Kの全ての成分が順番に1次方程式で定まるため、平方根が2つしかないことが言える。

英語版からの直訳

対角化可能でない行列の場合にはジョルダン標準形が利用できる。テンプレート:Efn2

すべての固有値が正の実数であるような任意の複素行列が、同じ条件の平方根を持つことを見るには、ジョルダンブロックの場合に証明すれば十分である。そのようなブロックは実数 テンプレート:Mvar および冪零行列 テンプレート:Mvar を用いて テンプレート:Math の形に書ける。平方根の二項級数展開 テンプレート:Math(収束域は テンプレート:Math)に対し、形式冪級数としての平方は テンプレート:Math に等しい。テンプレート:Mvarテンプレート:Mvar に置き換えれば、冪零性により有限個を除く全ての項は零となり、テンプレート:Math が固有値 テンプレート:Math に属するジョルダンブロックの平方根を与える。

一意性を見るには テンプレート:Math の場合に確認すれば十分である。上で構成した平方根を テンプレート:Math の形に書けば、テンプレート:Mvar は定数項を持たない テンプレート:Mvar の多項式である。固有値が正の実数となる他の任意の平方根 テンプレート:Mvarテンプレート:Math の形で テンプレート:Mvar が冪零かつ テンプレート:Mvar と(したがって テンプレート:Mvar と)可換となるようにとれる。しかしこのとき テンプレート:Math であり、また テンプレート:Mvarテンプレート:Mvar の可換性により テンプレート:Math は冪零ゆえ テンプレート:Math は可逆(逆行列はノイマン級数で与えられる)となるから、したがって テンプレート:Math.

すべての固有値が正の実数であるような行列 テンプレート:Mvar最小多項式テンプレート:Math とするとき、テンプレート:Mvar の一般固有空間へのジョルダン分解は テンプレート:Math の部分分数分解から導かれる。すなわち、対応する一般固有空間の上への射影は テンプレート:Mvar の実係数多項式として与えられ、各固有空間上で テンプレート:Mvar は上記の通り テンプレート:Math の形をしている。固有空間上での平方根の冪級数展開は、テンプレート:Mvar の主平方根が実係数多項式 テンプレート:Math に対する テンプレート:Math の形をしていることを示すものである。

現実的な計算法

「対角化」の方法でも「ジョルダン分解」の方法でも、すべての固有値を算出することが必要となるが、それは行列の特性方程式(あるいは最小方程式)のすべての解を求めることと同じであり、行列の次数が大きくなれば非現実的となる。このため、現実的な平方根の求め方が必要となる。

行列対数関数、行列指数関数による求め方

実数a>0の平方根aexp(12log(a))で求まることと同様に、

n次実数値正方行列Aの全ての特性根の実数部分が正である場合、

行列対数関数をlog(A)=log(c)IΣk=11k(I1cA)kと定義し(cは任意の正数、級数が収束すればcに係らず同じ値に収束する)

行列指数関数exp(X)=Σk=01k!Xkと定義すれば(Xはn次実数値正方行列)、

2乗するとAとなり、かつ全ての特性根の実数部分が正となる行列Aは、

A=exp(12log(A))により計算でき、かつこの行列に一意に定まる。

この方法は、固有値を全て求める必要がないこと(「全ての特性根の実数部分が正」という条件は、特性根を全て求めなくても、十分条件がいくつか知られている)、収束計算が速いこと、対称行列に限らず一般の行列に利用可能であることなど、現実的かつ速い計算方法になっている。

また、行列の平方根に限らず、n乗根も同様に計算することができる。

ニュートン法

実数の方程式f(x)=x2a=0ニュートン法で解く方法を、行列にそのまま適用して求める方法である。

n次正方行列Aに対し、n次正方行列の列Xmを次の漸化式で定める

Xm+1=12(Xm+AXm1)

この列が適当な初期値X0について収束すれば、収束値Xについて、X2=Aとなる。

このことは、収束すればX=12(X+AX1)が成り立つことから言える。

対称行列(エルミート行列)に限定した議論

以下では、対称行列(あるいはエルミート行列)に限定した行列の平方根についての性質を示す。 「正定値行列」とは、対称行列(あるいはエルミート行列)で、その全ての固有値が正の実数であるものをいう。「半正定値行列」とは、対称行列(あるいはエルミート行列)で、その全ての固有値がゼロまたは正の実数であるものをいう。

定義

転置あるいはエルミート共軛を用いれば、より一般に非対称あるいは非エルミートな矩形行列の範疇で「平方根」をとることができる。

定義
半正定値実正方行列 テンプレート:Mvar に対して、テンプレート:Math(あるいは テンプレート:Math、すなわちテンプレート:Mvarグラム行列)を満たす任意の矩形行列 テンプレート:Mvarテンプレート:Mvar非対称平方根 (asymmetric square root)[6] と呼ぶ。(記号 テンプレート:Math行列の転置を表す)
定義
半正定値複素正方行列 テンプレート:Mvar に対して、テンプレート:Math(あるいは テンプレート:Math)を満たす任意の矩形行列 テンプレート:Mvarテンプレート:Mvar非エルミート平方根 (non-Hermitian square root) と呼ぶ。(記号 テンプレート:Mathエルミート共軛を表す)

テンプレート:Mvar がエルミート(実係数の場合は対称)ならば、テンプレート:Mvar は上で述べたテンプレート:Mvarの平方根と一致する。任意の正定値エルミート行列 テンプレート:Mvar に対し、それ自身正定値エルミートとなる平方根は一意であり、これを主平方根 (unique square root, principal square root)[7]と呼ぶ。

コレスキー分解からも平方根の例が得られるが、コレスキー因子と(主)平方根とを混同してはならない。

非対称平方根のユニタリ自由度

正実数の平方根は、主平方根に テンプレート:Math を掛けたものですべて与えられた。これに対応するように、正定値エルミート行列の任意の非エルミート平方根は、ユニタリ変換によって関連付けられる[8]:

主張
半正定値行列 テンプレート:Mvar に対し、テンプレート:Math ならばユニタリ行列 テンプレート:Mvar が存在して テンプレート:Math と書ける。

実際、主平方根を テンプレート:Math と書けば、テンプレート:Mvar が正定値のとき テンプレート:Mvar は可逆で、テンプレート:Mathがユニタリであることは U*U=((B*)1A*)(AB1)=(B*)1T(B1)=(B*)1B*B(B1)=I. からわかる。テンプレート:Mvar が正定値でない半正定値行列のときは逆行列の代わりにムーア・ペンローズ擬逆行列 テンプレート:Math が取れて、作用素 テンプレート:Math は部分等長だから、テンプレート:Mvar の核の上で自明となるように拡張して テンプレート:Mvar が得られる。

応用

平方根およびそのユニタリ自由度は線型代数学および函数解析学の全般に応用を持つ。

極分解

テンプレート:Main 可逆行列 テンプレート:Mvar に対して、ユニタリ行列 テンプレート:Mvar および正定値行列 テンプレート:Mvar が一意に存在して テンプレート:Math と書ける。これを テンプレート:Mvar の極分解と呼ぶ。この正定値行列 テンプレート:Mvar は正定値行列 テンプレート:Mvar の主平方根であり、テンプレート:Mvarテンプレート:Math で求まる。

テンプレート:Mvar が可逆でないときでも、適当な方法で テンプレート:Mvar が定まれば(それは一意であり)極分解が定義される。極分解におけるユニタリ作用素 テンプレート:Mvar は一意ではないが、以下のようにして「自然な」ユニタリ行列は求められる: テンプレート:Mathテンプレート:Mvar の値域からそれ自身への作用素であり、これは テンプレート:Mvar の核上自明に延長してユニタリ作用素 テンプレート:Mvar にできるから、この テンプレート:Mvar を極分解に用いればよい。

一般化

  • 有限次元数空間上で行列を考える代わりに、任意のヒルベルト空間上の有界作用素に対して、その平方根を考えることができる。とくに有界半正定値作用素に対して、半正定値な平方根としての主平方根は一意に決まる。あるいは非エルミート平方根に関しても同様に考えることができる。無限次元の場合には、平方根がユニタリ作用素を施す違いを除いて決まるという事実は、作用素が閉値域ならば正しい。非有界作用素に対しては、かつ稠密に定義された二つの平方根 テンプレート:Mvar に対し部分等方な テンプレート:Mvarテンプレート:Math とできることなどは言える。

関連項目

脚注

テンプレート:脚注ヘルプ

注釈

テンプレート:Notelist2

出典

テンプレート:Reflist

参考文献

テンプレート:Linear algebra