ケプストラムのソースを表示
←
ケプストラム
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
'''ケプストラム'''({{lang-en-short|cepstrum}})は周波数[[スペクトル密度|スペクトル]]を信号と見なし[[フーリエ変換]]して得られる信号である<ref>"The log power spectrum can be considered as a 'frequency series'" B. P. Bogert, et al. (1963).</ref>。 [[ファイル:Cepstrum.png|サムネイル|図. 倍音+ノイズの波形/スペクトル/ケプストラム]] == 概要 == 時系列信号のフーリエ解析ではスペクトラムが得られる。得られた周波数系列信号に対しフーリエ解析をおこなったもの、すなわちスペクトルのスペクトルがケプストラムである。このためスペクトラム(spectrum)の[[アナグラム]]を用いてspectrum→cepstrumと名付けられた。ケプストラムには、[[複素数]]版と[[実数]]版がある。 ケプストラムは1963年、Bogert らの論文で定義された。ケプストラムの定義は以下の通り。 * 口語的定義: (信号の)ケプストラムとは、(信号の)フーリエ変換の対数([[位相アンラッピング]]を施したもの)をフーリエ変換したものである。スペクトルのスペクトルとも呼ばれる。 * 数学的定義: 信号のケプストラムは FT(log(|FT(信号)|)+''j''2π''m'') である。ここで ''m'' は、複素対数関数の虚数成分または角度の位相アンラッピングを正しく行うのに必要とされる整数である。 * [[アルゴリズム]]的定義: 信号 → FT → abs() → log → 位相アンラッピング → FT → ケプストラム 実数ケプストラムは、実数値について定義された[[対数]][[関数 (数学)|関数]]を使う。複素数ケプストラムは、複素数について定義された複素対数[[関数 (数学)|関数]]を使う。 複素ケプストラムは、最初のスペクトルの振幅と位相に関する情報を保持しており、信号の再構築が可能である。実数ケプストラムはスペクトルの振幅に関する情報しか保持しない。 処理過程を FT → log → IFT(フーリエ逆変換)として説明しているものがよく見受けられる。すなわち、ケプストラムを「スペクトルの対数のフーリエ逆変換」と定義しているのである。これはオリジナルの論文にある定義ではないが、広く用いられている。 ケプストラムの計算方法は様々である。位相アンラッピングを必要とするものも、必要としないものもある。 == 応用 == ケプストラムは、異なるスペクトル帯における変化の度合いに関する情報と見ることができる。本来、[[地震]]や[[爆弾]]の爆発を原因とする地震性[[反響]]の特性を調べるために考案された。また、[[レーダー]]信号の反射を解析するのにも使われてきた。 autocepstrum は、[[自己相関]]のケプストラムである。autocepstrum を用いるとデータに反響(エコー)がある場合にケプストラムよりも正確に解析ができる。 現在では、人間の声や音楽の信号を表す特徴ベクトルとしても使われている。この場合、スペクトルをまず[[メル尺度]]を使って変換する。その結果は[[メル周波数ケプストラム係数]](MFCC)と呼ばれる。これは[[話者認識]]や[[ピッチ抽出アルゴリズム]]などに応用されている。最近では[[音楽情報検索]]への応用に関心が集まっている。 これらの応用が生まれたのは、ケプストラムが声道によって歪められた信号から声帯の振動に起因するエネルギーだけを分離できるためである。 === ケプストラム分析 === '''ケプストラム分析'''({{lang-en-short|cepstrum analysis}})はケプストラムを用いた信号分析の総称である。 ケプストラム分析の例にスペクトルの成分分離がある。ケプストラムはリフタを用いて低周波成分と高周波成分に分離できる。低周波成分はスペクトルの(周波数方向における)ゆっくりとした変動を表現しており、スペクトル包絡に相当する。高周波成分はスペクトルの微細構造を表現していると解釈できる。 ケプストラム分析に基づいた[[音声分析]]('''ケプストラム音響分析''')でしばしば利用される<ref>{{Cite journal|和書|author=水田匡信, 土師知行, 阿部千佳 |year=2021 |url=https://doi.org/10.5112/jjlp.62.186 |title=ケプストラム解析による音響分析の有用性 : エビデンスと今後の展望 |journal=音声言語医学 |ISSN=0030-2813 |publisher=日本音声言語医学会 |volume=62 |issue=3 |pages=186-194 |doi=10.5112/jjlp.62.186 |CRID=1390007691441875072}}</ref>。音声/音響分析では[[楽音]]が[[倍音]]を持ちスペクトルの微細構造が周期性を有しているため、ケプストラムの高周波成分に明瞭なピークが現れる。この周期を検出することで音響信号の[[基本周波数]]を推定できる。また低周波成分によるスペクトル包絡を声道特性として解釈できる<ref>"ケプストラム分析による情報の分離 ... (声帯振動などの)細かな周波数特性の信号が(声道などの)滑らかな周波数特性のフィルタを通過して観測された信号から両者を分離する" 岡本. (2013). ''[http://abcpedia.acoustics.jp/bs13_q4.pdf Q4: ケプストラムって要するに何ですか?]''. 「音響学入門ペディア」作成に向けて. ASJ Beginners Seminar.</ref>。 このようにケプストラム分析を用いることで信号の様々な特性を明らかにできる。 == quefrency == ケプストラムのグラフにおける独立変数を '''quefrency'''(ケフレンシ)と呼ぶ(周波数、すなわち "frequency" のアナグラム)。quefrency は時間の尺度だが、信号の[[時間領域]]という意味での時間ではない。例えば、音声信号のサンプリングレートが44100Hzのとき、quefrency が 100 サンプルのケプストラムには大きなピークが現われた場合、そのピークは 44100/100 = 441 Hz というピッチの存在を示している。このようなピークがケプストラムに現われるのは、スペクトルにおける倍音が周期的で、その周期がピッチと一致しているためである。 == lifter == さらなるアナグラムを挙げると、ケプストラム上のフィルタ(filter)を '''lifter''' と呼ぶことがある。[[周波数領域]]における[[ローパスフィルタ]]と同じような性質を示す lifter をローパスlifterと呼ぶ。ローパスlifterを通した信号を時間領域に戻してやると、より滑らかな信号が得られる。 == 畳み込み == ケプストラム領域における重要な特性として、2つの信号の[[畳み込み]]は、それぞれのケプストラムの総和で表される。 :<math>x_1 * x_2 \rightarrow x'_1 + x'_2</math> == 派生 == === メル周波数ケプストラム === '''{{仮リンク|メル周波数ケプストラム|en|Mel-frequency_cepstrum}}'''({{lang-en-short|Mel-frequency cepstrum}}、'''MFC''')は[[スペクトログラム#メルスペクトログラム|メルスペクトラム]]に対するケプストラムである。MFCの生成には[[離散フーリエ変換]]ではなく[[離散コサイン変換]]を用いることが多い。 ==== メル周波数ケプストラム係数 ==== メル周波数ケプストラム係数({{lang-en-short|Mel-frequency cepstral coefficients}}、'''MFCC''')は[[ケプストラム#メル周波数ケプストラム|メル周波数ケプストラム]]の概形を表す係数である<ref>"ケプストラムから音声の特徴が表れる低次元 ... を抽出した情報がMFCCである{{harv|荒川.撫中|2019}}</ref>。[[ケプストラム#メル周波数ケプストラム|MFC]]に[[ケプストラム#lifter|リフター]]を適用した上で低次要素のみを残したものをMFCCとする場合が多い(例: 80次元メルスペクトラムに対する20次元MFCC)。 MFCCにiDCTを適用すると周波数空間へ戻り、これはスペクトラムの包絡とみなすことができる。 == 脚注 == {{reflist}} == 参考文献 == *{{Cite journal|author=B. P. Bogert, M. J. R. Healy, and J. W. Tukey |title=The Quefrency Analysis of Time Series for Echoes: Cepstrum, Pseudo-Autocovariance, Cross-Cepstrum, and Saphe Cracking |journal=Proceedings of the Symposium on Time Series Analysis |year=1963 |pages=209-243 |url=https://www.scirp.org/reference/referencespapers?referenceid=606525}} * {{Cite journal |author=Childers, Donald G and Skinner, David P and Kemerait, Robert C |year=1977 |url=https://doi.org/10.1109/PROC.1977.10747 |title=The cepstrum: A guide to processing |journal=Proceedings of the IEEE |volume=65 |issue=10 |pages=1428-1443 |publisher=IEEE |doi=10.1109/PROC.1977.10747}} * {{Cite journal|和書|author=荒川正規, 撫中達司 |date=2019-03 |url=https://opac-t.time.u-tokai.ac.jp/iwjs0018opc/TC10002501 |title=音を用いた再生可能資源の自動分別に関する研究 |journal=東海大学紀要. 情報通信学部 |ISSN=2185-5595 |publisher=東海大学情報通信学部 |volume=11 |issue=2 |pages=15-20 |CRID=1050017986932279808 |ref={{harvid|荒川.撫中|2019}}}} {{DEFAULTSORT:けふすとらむ}} [[Category:信号処理]]
このページで使用されているテンプレート:
テンプレート:Cite journal
(
ソースを閲覧
)
テンプレート:Harv
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:仮リンク
(
ソースを閲覧
)
ケプストラム
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報