三焦点テンソル

提供: testwiki
2022年8月26日 (金) 08:22時点におけるimported>V Melvilleによる版 (相関スライス: 直近の修正時ミスを修正)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

三焦点テンソル(さんしょうてんテンソル、英:trifocal tensor, tritensor)、または三重焦点テンソル(さんじゅうしょうてんテンソル)は、コンピュータビジョンの分野で用いられる3つのビュー間のすべての射影幾何学的関係を組み込んだ3×3×3の数値配列(テンソル)である。これは、3つのビュー内の対応する点または線の座標を関連付ける。シーン構造とは無関係であり、3つのビュー間の相対的な動き(ポーズ)とそれらの固有のキャリブレーションパラメーターのみに依存する。したがって三焦点テンソルは基礎行列を3つのビューに拡張したものとみなせる。テンソルは27個の要素で構成されているが、実際にはそのうちの18個だけが独立している。

いわゆるキャリブレーションされた三焦点テンソルも存在する。これは、3つのビューの点と線の座標を固有のパラメーターに関連付け、カメラの相対的な姿勢をグローバルスケールも含めて構成し、計11 の独立した要素(自由度)を表す。自由度の減少は非線形性の増加を犠牲にしてと、推定に使用する対応の数を減らすことができる[1]

相関スライス

テンソルは、その相関スライス(英 : correlation slices)として知られる3つのランク2の 3 x 3 行列𝐓1,𝐓2,𝐓3の集合とみなすこともできる。3つのビューの射影行列𝐏=[𝐈|𝟎]𝐏'=[𝐀|𝐚4]𝐏=[𝐁|𝐛4] であると仮定すると、対応するテンソルの相関スライスは𝐓i=𝐚i𝐛4t𝐚4𝐛it,i=13のように閉じた形式で次のように表現できる。ここで𝐚i,𝐛iはそれぞれカメラ行列のi番目の列である。ただし実際には、このテンソルは3つのビューにわたる点と線の一致から推定される。

三重線形拘束条件

三焦点テンソルの最も重要な特性の1つは、3つの画像の線と点の間に線形関係が生じることである。より具体的には、対応する点の3つ組を𝐱𝐱𝐱、それらを通る対応する直線を𝐥𝐥𝐥としたとき、次の三重線形拘束条件(英 : trilinear constraints)に従う。

(𝐥t[𝐓1,𝐓2,𝐓3]𝐥)[𝐥]×=𝟎t
𝐥t(ixi𝐓i)𝐥=0
𝐥t(ixi𝐓i)[𝐱]×=𝟎t
[𝐱]×(ixi𝐓i)𝐥=𝟎
[𝐱]×(ixi𝐓i)[𝐱]×=𝟎3×3

ここで[]×は、交代外積行列を意味する。

移送

3つのビューの三焦点テンソルと2つのビューの対応する点のペアが与えられたとき、3番目のビューの点の位置をそれ以上の追加情報なしで決定することができる。これは点移送(英 : point transfer)として知られており、線分と円錐曲線にも同様の移送が可能である。一般の曲線の場合、移送は接触円(曲率)の局所微分曲線モデルを通じて実現でき、円錐曲線として移送できる。 [2]キャリブレーションされた三焦点テンソルを使用した空間の歪みを反映する3次モデルの移送は研究されているが[3] 、キャリブレーションされていない三焦点テンソルについては未解決の問題が残っている。

推定

キャリブレーションされていない場合

古典的なケースは、3つの解を与える6点対応[4] [5]である。

9線対応から三焦点テンソルを推定するケースは、最近解決されたばかりである。 [6]

キャリブレーションされている場合

キャリブレーションされた三焦点テンソルを推定することは、非常に難しいとされており、4点対応が必要である。 [7]

3点のみの対応を使用するケースが最近解決された。この場合、点は接線方向または入射線に関連付けられる。入射線を持つ点が2つだけの場合、これは次数312の最小化問題であり(従って最大で312の解が存在する可能性がある)、各点に接線を持つ一般の曲線や方向性(SIFT方向等)を持った特徴点の場合に適している。[8]同じ手法で3つの点の対応と1つの線の対応が混在する場合も解決され、次数216で最小であることも示されている。

脚注

参考文献

外部リンク

アルゴリズム