アディティブ・シンセシス

提供: testwiki
ナビゲーションに移動 検索に移動

音響信号処理における加算合成(かさんごうせい、テンプレート:Lang-en-short)は複数の純音を重ね合わせ(加算して)音響信号を合成する、音声合成の一種である[1][2]アディティブ・シンセシスとも呼ばれる。対比される合成手法に減算合成がある。

概要

テンプレート:Listen音響信号は正弦波の重ね合わせで表現できる。またヒトの聴覚には可聴域が存在するため聞こえる周波数に上限がある。このことは周期信号と聴覚上等価な合成音を正弦波の有限和で表現できることを示唆する(詳細: #理論的背景)。

加算合成は有限個の正弦波を加算して音を合成する手法の総称である。正弦波の周波数・振幅・位相を適切に設定することで多様な音を生成・再現できる。

実装としては事前計算した波形テーブル(ウェーブテーブル・シンセシス)や逆高速フーリエ変換を活用できる。

合成要素となる個々の正弦波は部分音パーシャル)と呼ばれる。特に倍音はハーモニックパーシャル(調波)、非倍音はインハーモニック・パーシャル(非調波)と呼ばれる。

理論的背景

フーリエ級数による
方形波の近似(最初の4項)

音響信号は正弦波の重ね合わせで表現できる(フーリエ変換)。さらに信号が周期性を持っていれば、その信号は正弦波の無限和で(積分せずに)表現できる(フーリエ級数)。

y(t)=r0+r1cos(2πfot)++rkcos(2πkfot)+テンプレート:See alsoまた、ヒトには知覚可能な周波数範囲(可聴域)が存在する。標準的には15kHzが上限でありそれ以上の音を聞き取ることができない。これは信号から可聴域外の成分を取り除いても聴覚上の差がない(=等価である)ことを意味する。テンプレート:See alsoこの2つの事実は、ある周期的な音響信号と聴覚上等価な信号を正弦波の有限和で表現できることを示唆する。なぜなら正弦波の無限和に含まれる15kHz以上の正弦波成分を除いても聴覚上等価な信号が構成でき、それは有限個の正弦波の和を意味するからである。

手法

加算合成は有限個の正弦波を加算して音を合成する手法の総称である。パラメータの時変性や周波数制約に基づき、様々なタイプの加算合成が存在する。

以下、各部分音のインデックスを k、初期位相を ϕk、部分音の総数を K、合成音を y(t) とする。各部分音において周波数を fk、振幅を rk とし、これが時変の場合は瞬時周波数 fk(t)、瞬時振幅 rk(t) を用いる。

次の表は様々な制約をもった加算合成を表現する式の一覧である。各手法は以降の節で詳説されている。

表. 制約付き加算合成
時変振幅 (AM) 時変周波数 (FM) 調波構造 合成式
- - - y(t)=k=1Krkcos(2πfkt+ϕk)
- - y(t)=k=1Krk(t)cos(2πfkt+ϕk)
- - y(t)=k=1Krkcos(2π0tfk(u)du+ϕk)
- y(t)=k=1Krk(t)cos(2π0tfk(u) du+ϕk)
y(t)=k=1Krk(t)cos(2π0tkfo(u) du+ϕk)

時不変

時不変加算合成器の構成定周波数・振幅の正弦波が生成(〜)、加算(+)されて合成音となる。

単純な加算合成では単一合成区間内で周波数と振幅を固定する(時不変)。この方式は次のように定義される[3]

y(t)=k=1Krkcos(2πfkt+ϕk)

時変振幅

振幅が時間変化するハーモニック・アディティブ・シンセシスの例
(基本周波数 f0 = 440 Hz)
ファイル:Harmonic additive synthesis.ogg

振幅を時間に応じて変化させる場合(c.f. 振幅変調)、次のように定義される:

y(t)=k=1Krk(t)cos(2πfkt+ϕk)

帯域制限(band-limited signal)の観点から、rk(t) の変化は振幅変調による帯域の広がり Δfrk(t)が 隣接部分音間の周波数間隔より有意に小さくなるよう[4][5][注釈 1]、充分ゆっくりした速度で変化させる必要がある[1][注釈 2]。すなわち次の制約を留意する必要がある。

ddtrk(t)|rk|Δfrk(t)|fkfk1|

時変周波数

周波数を時間に応じて変化させる場合(c.f. 周波数変調)、次のように定義される[注釈 3]

y(t)=k=1Krkcos(2π0tfk(u)du+ϕk)
振幅と周波数の両方が時間変化するインハーモニック・アディティブ・シンセシスの例 ファイル:Inharmonic additive synthesis.ogg

時変振幅・時変周波数

最も一般化された加算合成は次のように定義される:

y(t)=k=1Krk(t)cos(2π0tfk(u)du+ϕk)

調波加算合成

自然界に存在する多くの音は調波構造を有している。すなわち基本周波数 fo 成分(基音)とその整数倍成分(倍音)を多分に含んでいる。このことに注目し、部分音として基音および倍音のみを加算して音を合成する手法を調波加算合成(ハーモニック・アディティブ・シンセシス)という。

時不変振幅・周波数を用いた調波加算合成は次のように定義される:

y(t)=k=1Krkcos(2πkfot+ϕk)

周波数が kfo で定義されるため、部分音#k はk次倍音(k=1なら基音)に相当する。

広義の定義

アディティブ・シンセシス」という用語は広義に、正弦波ベースか否かを問わず「単純な基本要素を足し合わせて複雑な音色を合成する」タイプのサウンド・シンセシス手法全般を指す包括的用語として使われる事がある。[6][7] 例えば F. Richard Mooreはサウンド・シンセシスの「四つの基本カテゴリー」として、アディティブ・シンセシスを他の三つと共に挙げている。[7]

この広義の意味で、正弦波以外の音色(パイプやストップ)を組み合わせるパイプオルガン電子オルガンも広義のアディティブ・シンセサイザーと見なせる。また主成分(変量間の相関行列の固有値分解で得られる合成基底)やテンプレート:仮リンクWalsh-Hadamard変換の基底関数)の総和による音響合成も、広義のアディティブ・シンセシスに分類できる。[8]

加算分析/再合成

テンプレート:Main 音声信号の分析により周波数・振幅・位相が得られれば、これを加算合成に用いて音声を再構築できる。分析合成を一体で捉えた音声処理を音声分析合成という。合成部に加算合成を用いる場合、分析部に用いられる手法の例として帯域通過フィルタバンク短時間フーリエ変換McAulay-Quatieriアナリシス[9][10])、経験的モード分解[11]が挙げられる。

合成部に加算合成を用いる具体的な手法としては以下が一例に挙げられる。

  • Sinusoidal Modeling[12] — 正弦波の総和による調波合成モデル
  • Reassigned Bandwidth-Enhanced Additive Sound Model[13][14]
    — McAuley-Quatieriアルゴリズムのノイズ耐性改善のために、Bandwidth-enhanced Oscillatorを導入したSinusoidal Model。

またソフトウェア実装には下記がある:

応用例

楽器

テンプレート:Double image aside テンプレート:Main

アディティブ・シンセシスは、ハモンド・オルガンや、シンセサイザー電子楽器に応用されている。テンプレート:-

音声合成

音声波形とスペクトログラム(下):
赤点列は5つのフォルマント周波数、
下側水色カーブは基底周波数(ピッチ)

テンプレート:Main

言語学の研究では1950年代初頭より、合成あるいは変更した音声スペクトログラムの再生にハーモニック・アディティブ・シンセシスが使用されている。[20] 1980年代初頭には、音声の音響的手がかり(acoustic cues)の意義を評価するために、それらを取り去った合成音声の聴取テストが行われた。[21] また線形予測符号で抽出したフォルマント周波数と振幅の時系列を使う音声合成手法の一つ sinewave synthesis は、インハーモニックな正弦波パーシャルの加算合成を行う。[22](関連:Sinusoidal Modelingテンプレート:-

実装方式

今日のアディティブ・シンセシス実装系は、主にデジタル処理で実装されている(#離散表現参照)。

オシレータ・バンク

アディティブ・シンセシスは、各パーシャルに対応して正弦波オシレータを複数用意したオシレータ・バンクで実装できる[1](記事冒頭の図参照)。

ウェーブテーブル・シンセシス

テンプレート:Main 楽音がハーモニックで準周期的な場合、ウェーブテーブル・シンセシスは時間発展のあるアディティブ・シンセシスと同様な一般性を備え、しかも合成に必要な計算量は少なくて済む。[23] 従って、ハーモニックな音色合成のための時間発展のあるアディティブ・シンセシスは、ウェーブテーブル・シンセシスで効率的に実装できる。

グループ・アディティブ・シンセシス(Group additive synthesis)[24][25][26] は、各パーシャルを基本周波数の異なるハーモニック・グループに分け、各グループ個別にウェーブテーブル・シンセシスで合成後、ミックスして結果を得る手法である。

逆高速フーリエ変換

高速フーリエ変換は、変換周期を均等分割した周波数[注釈 4] に関する(加算)合成を効率的に行える。また、離散フーリエ変換の周波数領域表現を注意深く考慮すれば、複数の逆高速フーリエ変換結果をオーバーラップさせた列を使って、任意周波数の正弦波による(加算)合成を効率的に行える。[27]

歴史的背景

テンプレート:Notice

テンプレート:Multiple image

調和解析

調和解析は、1822年フランスの数学者ジョゼフ・フーリエ[28]熱伝導の文脈で彼の研究に関する広範な論文を発表して、研究が端緒に付いた。[29] この理論の初期の応用には、潮の干満の予測がある。1876年頃、[30] ケルビン卿ことウィリアム・トムソンは機械式の潮汐予測機(Tide-predicting machine)を構築した。この装置はharmonic analyzerharmonic synthesizerで構成され、それらは19世紀に既に前述の名で呼ばれていた。[31][32] 潮汐の測定値は、ケルビン卿の兄ジェームズ・トムソン積分機integrating machine)を使い分析された。結果として得られたフーリエ係数は、紐と滑車のシステムを使ったsynthesizerに入力され、将来の潮汐の予測のための正弦波基底の調和部分波が生成され足し合わされた。同様な装置は1910年にも、音の周期波形の解析を目的として構築された。[33] この装置のsynthesizer部は合成波形をグラフに描画し、それは主に解析結果の視覚的検証に使用された。[33]

フーリエ理論の音への応用

フーリエ理論の音への応用は、1843年ゲオルク・オームによって行われた。この系統の研究はヘルマン・フォン・ヘルムホルツにより大きな進歩を遂げ、彼は8年間の成果を1863年出版した。[34] 彼は、音色の心理的知覚は学習によるものだが、官能的感覚は純粋に生理的なものだと信じていた。[35] また彼は、音の知覚は基底膜の神経細胞からの信号に由来し、これら細胞の弾性付属物は適切な周波数の純粋な正弦波トーンに共鳴振動する、という考えを支持した。[33] この他ヘルムホルツは、ある種の音源はインハーモニック(基底周波数の非整数倍)な振動モードを含むとする エルンスト・クラドニの1787年の発見に同意した。[35]

ヘルムホルツのサウンド・シンセサイザー

テンプレート:Multiple image

テンプレート:Multiple image

ヘルムホルツの時代、電子的な音響増幅手段(アンプ)はまだ存在しなかった。ヘルムホルツは、ハーモニック・パーシャルに基づく音色合成(ハーモニック・アディティブ・シンセシス)を目的として、パーシャル生成用の電磁石励起式音叉と、音量調整用のアコースティックな共鳴チャンバー (ヘルムホルツ・レゾネータ) の組を並べた装置を製作した。[36] 製作は少なくとも1862年という早い時期に行われ、[36] 次にテンプレート:仮リンクにより洗練され、1872年ケーニッヒの装置の実演が行われた。[36] ハーモニック・アディティブ・シンセシスに関し、ケーニッヒは彼の音波サイレン(wave siren)に基づく大型装置も製作した。この装置は空気圧式で、切断したトーンホイールを使っていたが、パーシャルの正弦波精度が低い点を批評された。[30] なお19世紀末に登場したテンプレート:仮リンクTibiaパイプは正弦波に近い音波を発生でき、アディティブ・シンセシスと同様な方法で組み合わせる事ができる。[30]

アディティブとサブトラクティブ

1938年ポピュラーサイエンス誌で、人間の声帯は消防サイレンのように機能して、倍音に富んだ音色を生成し、その音色は声道でフィルタリングされ、異なる母音の音色が生成される、とする説が新しい重要な証拠と共に[37]報じられた。[38](関連:ソース・フィルタモデル)既に当時、アディティブ方式のハモンドオルガン(トーンホイールによる電気機械式実装)が市販されていた。しかし初期の電子オルガン・メーカの大多数は、大量のオシレータを要するアディティブ方式オルガンの製造は高価過ぎると判断し、代わりにサブトラクティブ方式オルガンの製造を開始した。[39] 1940年無線学会(IRE)の会議でハモンドのフィールド・エンジニア長は、従来の「音波を組合せて最終的な音色を組み上げる[注釈 5]ハモンドオルガンとは対照的な、「サブトラクティブ・システム」を採用した同社の新製品ノヴァコードについて詳しい説明を行った。[40]

Alan Douglasは1948年のRoyal Musical Associationの論文で、異なる方式の電子オルガンを説明するために修飾子「アディティブ」と「サブトラクティブ」を使った。[41] 現代的な用法のアディティブ・シンセシスサブトラクティブ・シンセシスという用語は、彼の1957年著作“The electrical production of music”に登場しており、音色生成の3つの手法が次の3つの章に示されている:[42]

  • アディティブ・シンセシス(additive synthesis
  • サブトラクティブ・シンセシス(subtractive synthesis
  • 他の形態の組合せ(Other forms of combinations

現代のアディティブ・シンセサイザーは典型的に、出力を電気アナログ信号やデジタルオーディオの形で生成する。後者の例には2000年前後に一般化したソフトウェア・シンセサイザーが含まれる。[43]

年表

以下に、歴史的もしくは技術的に注目に値するアディティブ・シンセシスの実装例(電気/アナログ/デジタル式のシンセサイザーやデバイス)を年表形式で示す。

初期実装 商用化 組織 名称 概要 サンプル
1900[44] 1906[44] New England Electric Music Company Telharmonium ポリフォニックかつタッチセンシティブな、最初のサウンド・シンセサイザー[45]
実装: 正弦波加算合成。トーンホイールオルタネーターを使用。
発明者:Thaddeus Cahill
no known recordings[44]
1933[46] 1935[46] Hammond Organ Company ハモンドオルガン Telharmoniumと同様な方式で大きな商業的成功を収めた、電気楽器式アディティブ・シンセサイザー[45]
実装:正弦波加算合成。トーンホイールマグネティック・ピックアップを使用。
発明者Laurens Hammond
テンプレート:Audio
1950 or earlier [20]   Haskins Laboratories Pattern Playback スピーチ・シンセサイザー

実装:ハーモニック・パーシャル(整数次倍音)の振幅を、手描きまたは分析で得たスペクトログラムで制御。各パーシャル(部分音)は、マルチトラックの光学式トーンホイールで生成。[20]

samples
1958[47]     ANS 微分音(マイクロトーナル)を扱う光学-電子式アディティブ・シンセサイザー[48]

実装:マルチトラックの光学式トーンホイールで、マイクロトーナル・パーシャル列(微分音列)を帯状の光源として生成。黒い樹脂を塗布したガラス表面を引掻いて作成したマイクロトーナル・スコア(スペクトログラム類似)を、時間軸方向に光電管でスキャンして音を合成。
発明者Evgeny Murzin
関連:1959年Hugh Le Caineが、電子音源Oscillator Bank と入力デバイス Spectrogramから成る同様な楽器を開発。[49][50]

テンプレート:Audio
1963[51]   MIT   楽器音色をアタックテンプレート:要曖昧さ回避部と定常部に分け、デジタルで スペクトル分析/再合成 を行うオフライン処理システム

発明者:David Luce[51]

 
1964[52]   イリノイ大学 Harmonic Tone Generator 電圧制御式電子回路によるハーモニック・アディティブ・シンセシスのシステム

発明者:James Beauchamp.[52][53]

samples (info)
1974 or earlier [54][55] 1974 [54][55] RMI Harmonic Synthesizer デジタル・オシレータを使いアディティブ・シンセシス[56]を実装した最初のシンセサイザー製品、[54][55] 時間変化するアナログ・フィルタも備えている[54]

関連: RMIの親会社Allen Organ Companyは1971年、North American Rockwellが開発したデジタル・オルガン技術に基づき、世界最初の教会用デジタル・オルガン製品 Allen Computer Organを発売した。[57]

1 2 3 4
1974[58]   EMS (London) Digital Oscillator Bank ミニコン制御でデジタル式の 分析/再合成楽器(チャンネル・ヴォコーダ類似)

実装:複数のデジタル・オシレータの組(バンク)。任意波形を利用可能、周波数と振幅を個々に制御可能。[59] EMS製作のデジタル式Analysis Filter Bank (AFB)と組み合わせ、分析/再合成に使用。[58][59]
別名DOB.

in The New Sound of Music[60]
1976[61] 1976[62] Fairlight Qasar M8 完全デジタル処理のシンセサイザー、高速フーリエ変換を使用[63]

実装: 各ハーモニクスの振幅エンベロープを、画面にライトペンで描き、高速フーリエ変換でサンプリング・データを生成[64]

samples
1977[65] (1980) [66] ベル研究所 Digital Synthesizer リアルタイム計算によるデジタル・アディティブ・シンセサイザー、[65] 「最初の真のデジタル・シンセサイザー」と呼ばれている[67]

別名Alles Machine, Alice.
関連:Music TechnologiesがCrumarと提携し、1980年Crumar GDS として製品化。

sample (info)
1979[67] 1979[67] New England Digital Synclavier II デジタル・シンセサイザー製品

実装:アディティブ・シンセシスで生成した複数の波形を、クロスフェードでスムースに切り替えて音色の時間発展を実現。

(File:Jon_Appleton_-_Sashasonjon.oga)

離散表現

テンプレート:Notice

アディティブ・シンセシスのデジタル実装では、これまで扱ってきた連続時間の式(連続時間形式)の代わりに、離散時間の式(離散時間形式)を用いる。

連続時間形式(テンプレート:EquationNote)を出発点とする:

y(t)=k=1Krk(t)cos(2π0tfk(u) du+ϕk)=k=1Krk(t)cos(θk(t))

連続時間形式を書き換えて離散時間形式を得るために、下記の置換を使う:

時刻:      t n/fs
出力:    y(t)y[n]
振幅:    rk(t)rk[n]=rk(n/fs)
瞬時周波数: fk(t)fk[n]=(n1)/fsn/fsfk(u)du [注釈 6]
瞬時位相:  θk(t)=2π0tfk(u)du+ϕk  θk[n]=2πfsi=0nfk[i]+ϕk
  (dt=dn/fs)

すると次の離散時間形式が得られる:

y[n]=k=1Krk[n]cos(2πfsi=1nfk[i]+ϕk)=k=1Krk[n]cos(θk[n])

ここでθk[n] の差分より

θk[n]=θk[n1]+2πfsfk[n] ,n>0θk[0]=ϕk

である。[27]

脚注

テンプレート:脚注ヘルプ

注釈

テンプレート:Reflist

出典

テンプレート:Reflist

参考文献

関連項目

外部リンク

テンプレート:サウンド・シンセシス方式

  1. 1.0 1.1 1.2 テンプレート:Harvnb, Additive Synthesis (Early Sinusoidal Modeling), "The term “additive synthesis” refers to sound being formed by adding together many sinusoidal components ..."
  2. テンプレート:Citation
  3. テンプレート:Harvnb, Additive Synthesis
  4. テンプレート:Citation
  5. テンプレート:Citation
  6. テンプレート:Harvnb
  7. 7.0 7.1 テンプレート:Citation
  8. テンプレート:Harvnb
  9. テンプレート:Citation
  10. テンプレート:Citation
  11. テンプレート:Citationテンプレート:リンク切れ
  12. テンプレート:Harvnb
  13. テンプレート:Citation
  14. テンプレート:Citation
  15. ARSS: The Analysis & Resynthesis Sound Spectrograph
  16. SPEAR Sinusoidal Partial Editing Analysis and Resynthesis for MacOS X, MacOS 9 and Windows
  17. Sinusoidal Modeling and Lemur, CERL Sound Group
  18. Loris Software for Sound Modeling, Morphing, and Manipulation テンプレート:Wayback, CERL Sound Group
  19. SMSTools application for Windows
  20. 20.0 20.1 20.2 テンプレート:Citation
  21. テンプレート:Citation
  22. テンプレート:Citation
  23. テンプレート:Citation
  24. テンプレート:Citation
  25. テンプレート:Citation
  26. テンプレート:Citation
  27. 27.0 27.1 テンプレート:Citation
  28. テンプレート:Citation
  29. テンプレート:Citation
  30. 30.0 30.1 30.2 テンプレート:Citation
  31. テンプレート:Citation
  32. テンプレート:Citation
  33. 33.0 33.1 33.2 テンプレート:Citation
  34. テンプレート:Citation
  35. 35.0 35.1 テンプレート:Citation
  36. 36.0 36.1 36.2 テンプレート:Citation
  37. テンプレート:Citation
  38. テンプレート:Citation
  39. テンプレート:Citation
  40. テンプレート:Citation
  41. テンプレート:Citation
  42. テンプレート:Citation
  43. テンプレート:Citation
  44. 44.0 44.1 44.2 テンプレート:Citation
  45. 45.0 45.1 テンプレート:Citation
  46. 46.0 46.1 テンプレート:Citation
  47. テンプレート:Citation
  48. テンプレート:Citationテンプレート:リンク切れ
  49. テンプレート:Citation
  50. テンプレート:Citation
  51. 51.0 51.1 テンプレート:Citation
  52. 52.0 52.1 テンプレート:Citation
  53. テンプレート:Citation
  54. 54.0 54.1 54.2 54.3 テンプレート:Citation
  55. 55.0 55.1 55.2 テンプレート:Citation
  56. テンプレート:Citation
  57. テンプレート:Citation
  58. 58.0 58.1 テンプレート:Citation
  59. 59.0 59.1 テンプレート:Citation
  60. テンプレート:Citation Includes a demonstration of DOB and AFB.
  61. テンプレート:Citation
  62. テンプレート:Citation
  63. テンプレート:Citation
  64. テンプレート:Citation
  65. 65.0 65.1 テンプレート:Citation
  66. テンプレート:Citation
  67. 67.0 67.1 67.2 テンプレート:Citation


引用エラー: 「注釈」という名前のグループの <ref> タグがありますが、対応する <references group="注釈"/> タグが見つかりません