音響心理学のソースを表示
←
音響心理学
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{参照方法|date=2024年3月}} '''音響心理学'''(おんきょうしんりがく、{{lang-en|psychoacoustics}})は、[[人間]]の[[聴覚]]に関する[[学問]]である。[[音響学]]の[[物理]]的[[パラメータ]]に関連した[[心理学]]的学問でもある。'''聴覚心理学''' (auditory psychology) とも。 == 背景 == 聴覚は、[[音波]]の機械的現象としてだけでは説明できず、[[知覚]]や[[認知]]的側面もある。人が何かを聴くとき、[[大気]]を通して音波が[[耳]]に到達し、耳の中でそれが[[神経]]の[[活動電位]]に変換される。その神経[[パルス]]は[[脳]]に到達し、知覚される。[[音響信号処理]]など音響学に関わる問題では、単に音波の[[物理的性質]]を考慮するだけでなく、耳と脳が各人の聴覚に重要な役割を果たしている点を考慮することが重要となる。 例えば、耳は音を神経刺激に変換する際に[[周波数スペクトル]]への分解を行う。この解析は[[蝸牛]][[基底膜]]における機械的な特性による[[フィルタバンク|フィルタ・バンク処理]]によって実施される。このフィルタ・バンクは[[中心周波数]]にほぼ比例して[[バンド幅]]が広がる、いわゆる定Q型のものであるため、その特性からこの[[スペクトル解析]]は[[フーリエ解析|フーリエ分析]]的なものではなく、[[ウェーブレット|ウェーブレット分析]]的なものとなる。そのため、[[時間領域]]の情報の一部は失われてしまう。しかし、基底膜の振動を中枢へ伝える神経パルスは基底膜が特定の方向へ変位したときに[[発火]]するという性質を持ち合わせるため、振動に含まれる時間的な情報は神経発火の時間パターンとして中枢へ伝えられていることも知られている。[[MP3]] の圧縮方法は基底膜上に複数の振動成分が与えられた場合の相互作用、すなわち[[#マスキング効果|マスキング]]を考慮して実効的な[[ダイナミック・レンジ]]を狭めることによる[[情報圧縮]]を利用している。さらに、耳の[[ダイナミック応答]]は[[対数関数]]的である。[[公衆交換電話網]]はこの現象を利用して、音声を対数的に圧縮し、指数的に伸張して再生している。また、耳の[[非線形]]性の副次効果として、[[周波数]]の近い音が2つあるとき、実際には存在しない低い周波数の音が聞こえてくる。このような耳の解剖学的特徴に起因する生理的現象も音響心理学的現象としてひとまとめに扱われるのが一般的である。 脳によって生じる真の音響心理学的現象もある。例えば、録音された[[音楽]]にパチパチという雑音(ノイズ)があっても、人はそのような[[ノイズ]]を気にせずに音楽を楽しめる。人によってはノイズを全く忘れてしまう場合もあり、後でノイズがあったかどうかを聞いても答えられないことがある。これを心理音響マスキングのレベルで説明する場合もある。この場合、ノイズの存在があってもなくても知覚的にはその違いが分からない。これとは別に、雑音の存在があってもそれが注意している音には[[干渉]]しないで聞くような場合も存在する。これは[[音脈分凝]]と呼ばれる現象であり、心理音響的マスキングとは異なるレベルでの処理が貢献している。脳がそのようなマスキングを行う能力は、様々に利用されている。ただし、[[デジタル信号処理]]では、この現象はアナログの[[ホワイトノイズ]]全体をカバーするというよりも、圧縮によって失われた部分を隠すのに使われることが多い。別の心理音響現象として、脳は[[パターン認識]]のために相関的プロセスを使うと考えられており、同様な技法は[[電子回路]]で信号パターンを探すのにも使われている。相関的な一致を受け入れる[[しきい値]]が非常に低い場合、純粋なノイズや少しだけ似ているような音声からもよくあるパターンを補完して聞き取ってしまう。例えば、[[無線通信士]]がノイズの多い中で[[モールス符号]]を聞き取ろうとしていると、実際にはモールス符号がないにも拘らず、ノイズからモールス信号を聞き取ってしまう。このような心理音響現象は、例えば非常に危険な状況で知覚力を高めるのに重要な役割を果たす。これは脳が勝手に知覚を生成する[[幻聴]]とは異なる{{要出典|date=2008年2月}}。 == 知覚の限界 == 人間の耳は、一般に周波数20[[ヘルツ|Hz]]から20,000 Hz (20 kHz) の音波を音として知覚する。周波数の上限は加齢と共に低くなる傾向があり、成人では一般に16 kHz より高い音は聞こえない。耳は20 Hz未満の音は知覚できないが、[[触覚]]で感じることができる{{要出典|date=2011年2月|title=20Hz未満の音波を触覚で感じることができる客観的な資料}}。 耳の周波数識別能力としては、中音域で約2 Hz 以上の違いを聞き分けることができる。ただし、別の手段でそれ以下の周波数の違いを知覚することもできる。例えば、2つの近い周波数の音があると、別の低い周波数の音の変化が聞こえる。いわゆる[[うなり]]である。 人間の耳は周波数を対数的に知覚する。言い換えれば、知覚される[[音高]]は周波数と[[指数関数]]的関係にある。[[音階]]がその例で、1[[オクターブ]]音高が上がると基本周波数は約2倍になる。ある音の周波数を約 <math>2^\frac{1}{12}</math> 倍すると、次の[[半音]]高い音になる。半音12個分高いと1オクターブ高い音になるので、<math>2^\frac{12}{12}</math> すなわち2倍の周波数ということになる。 つまり、西洋の音楽で使われている半音による音階は、周波数に対して[[線型性|線形]]ではなく、対数的である。聴覚の研究で使われる[[Mel尺度]]や[[Bark尺度]]も経験則から設定されており、やはり周波数に対して対数的である。 空気中の[[音圧]]の変化が耳に達すると、耳では音圧の振幅の大小により[[基底膜]]の振幅が定まり、それに応じた数のインパルスを[[コルチ器官]]が発して[[大脳]]へ伝えることで、知覚される音の大きさの大小が定まる。こうした音の知覚的な大きさを表す'''[[音の大きさ]]'''('''ラウドネス''')は、感覚量であり、物理的に直接測定することはできないが、基本的には音のエネルギーと対応しており、[[音の強さ]](音響インテンシティ)が増せば音は大きく感じられる。また、基底膜の振動部位は音の[[周波数]]によって異なるため、音の大きさは周波数によっても左右されるほか、音の時間構造にも依存する{{sfn|山本・高木『環境衛生工学』|1988|pp=72-77,80}}{{sfn|安藤・鈴木・古川『基礎音響学』|2019|p=111}}{{sfn|『音の百科事典』|2006|p=97|loc=「音の大きさ」}}。 一般的に人間の聴覚で音としてとらえられる音圧は、最小で20μPa程度、最大で20Pa程度とされ、この範囲(2.0✕10<sup>-5</sup> - 2.0✕10<sup>1</sup>[Pa])の音圧を可聴域と呼ぶが、その範囲は幅広い。音の大きさに対する知覚も対数的である。そのため、音圧を1 kHzにおいて聞き取れる最小可聴値とされる音圧である20μPaとの比の2乗の[[常用対数]]である[[音圧レベル]](単位は[[デシベル]])により表す{{sfn|山本・高木『環境衛生工学』|1988|p=77}}{{sfn|清水『一般音楽論』|2021|pp=306,307}}。 可聴な最小の音の音圧レベルは、0 [[デシベル|dB]]に相当し、可聴域を上回る大きさの圧力変化では鼓膜が空気振動により傷つけられ、痛みが感じられる{{sfn|清水『一般音楽論』|2021|pp=306,307}}。 長期間にわたる重度騒音は、[[聴覚障害]]([[音響外傷]])の原因となる。これは、その音が連続する時間にも依存し、120 dB の音は、短時間なら後遺症を引き起こさない(不快あるいは苦痛を伴う可能性はある)が、80 dB の音を長時間聞き続けると、後遺症が残る可能性がある{{要出典|date=2011年2月|title=音圧と暴露時間、そして難聴の関係を示す客観的な資料}}。 可聴な最小の音をもっと厳密に測定してみると、周波数によって可聴な最小の音圧が異なることがわかる。様々な周波数で聞こえる最小の音を測定していくと、周波数を横軸とした[[最小可聴値]] (ATH) 曲線が得られる。一般に、耳の感度(ATHの最小点)は1kHzから5kHzの間にピークがあるが、その値は加齢と共に変化し、老人になるほど2kHz 以上の感度が悪くなる{{要出典|date=2011年2月|title=加齢とオージオグラムの関係を示す客観的な資料}}。 ATH は最小の[[等ラウドネス曲線]]である。等ラウドネス曲線は可聴周波数範囲について同じ大きさの音と知覚される音圧レベル (dB) で表される。等ラウドネス曲線を初めて測定したのは、[[1933年]]、[[ベル研究所]]の Fletcher と Munson で、[[ヘッドフォン|ヘッドホン]]で純粋な音を再生して測定された。彼らはその曲線を Fletcher-Munson 曲線と呼んだ。各人が主観的に音の大きさをどう感じているかは測定が困難であるため、Fletcher-Munson 曲線は多人数の測定結果を平均して描かれた。 [[1956年]]、Robinson と Dadson が測定手法を改善し、[[無響室]]で前面からの音を使って新たな等ラウドネス曲線を得た。Robinson-Dadson 曲線は[[1986年]]、[[国際標準化機構|ISO]] 226 として標準化された。[[2003年]]、12か国の研究で得られたデータを元に ISO 226:2003 として改版された。 == マスキング効果 == 通常なら明瞭に聞こえる音が、別の音で[[マスク]]されて聞こえなくなることがある。例えば、雑踏での会話は、周囲の騒音により聞こえづらくなる。このような現象を'''[[マスキング]]'''という。小さい音は、大きい音でかき消される。マスキング現象は、大きな音が最小可聴値 (ATH) 曲線を歪め、通常なら聞こえるはずの音が可聴範囲外となるために発生する。 === 同時マスキング === {{Main|同時マスキング}} 2つの音が同時に発生して、一方が他方にマスクされる場合を[[同時マスキング]]という。これを周波数マスキングともいう。音色によっても他の音をマスクする度合いが異なる。[[正弦波]]で[[ノイズ]]的な音をマスクするには大きな音にする必要があり、逆にノイズで正弦波をマスクする場合はそれほど大きな音である必要はない。マスキングをコンピュータで[[数理モデル|モデル]]化する場合、[[音色]]ごとの周波数ピークで分類する。 === 経時マスキング === {{Main|経時マスキング}} 同様に、大きな音の直後に小さな音があっても、大きな音でマスキングされる。さらに大きな音の直前の小さな音もマスキングされる。このようなマスキングを[[経時マスキング]]という。 == ミッシングファンダメンタル == '''{{仮リンク|ミッシング・ファンダメンタル|en|Missing fundamental}}'''は複合音の[[音高]]認知において幻聴される[[基本周波数]]である<ref>"基本周波数は存在していませんが、残っている周波数成分から、欠落した基本周波数成分(=ミッシング・ファンダメンタル)が推定され、それに対応する高さ(ピッチ)が知覚されるのです。" NTT. [http://illusion-forum.ilab.ntt.co.jp/missing-fndamental/index.html ミッシング・ファンダメンタル].</ref>。 人間が知覚する音の高さ([[音高]])は音波が物理的にもつ[[基本周波数]]と強い結びつきを持つ<ref>"純音の場合には、知覚される音の高さ(これをピッチと言います)は単純に周波数の高低に対応します。" NTT. [http://illusion-forum.ilab.ntt.co.jp/missing-fndamental/index.html ミッシング・ファンダメンタル].</ref>。周期性を持つ音の[[周波数スペクトル]]は、いわゆる調波構造を持つ[[離散スペクトル]]となる。一般的には、[[基本周波数]]成分([[基音]])とその整数倍の正弦波([[倍音]])から構成される。ところで音の重なり合わせ等の結果、基本周波数成分が失われ倍音のみで構成されたとする。この音を人間が聴いた場合、もし人間が一番下の周波数成分から音高を判断しているなら、第2倍音に相当する音高が認知されるはずである。しかし実際には、このような音で知覚される音高は、<u>失われた</u>はずの<u>基本周波数</u>(<u>ミッシング</u>・<u>ファンダメンタル</u>)に対応する音高となる。 この背景には、[[聴神経]]の発火が基底膜で分解されたのちに、その基底膜の特定の[[位相]]に限定して生じることがある(位相固定性)。この位相固定が成立する周波数には限界があることが知られており、大凡3kHz から4kHz で位相固定性は崩れるとされている。従って、ミッシング・ファンダメンタルに対応したピッチが聞こえる限界も、この辺りが上限となっている。ミッシング・ファンダメンタルに対応したピッチが聞こえるという現象は、しばしば他の感覚領域にも生じる知覚的補完の一種のように取り扱われることもあるが、これは適切とは言えない。むしろ、もともと我々がピッチという感覚を抽出する機構が、波形に備わる周期性を時間的に捉えているからである聞こえている<ref>{{Cite book |title = An Introduction to Phonetics and Phonology |author = Colin Yallop and Janet Fletcher |publisher = Blackwell Publishing |date = 2007年 |isbn = 1405130830 |url = https://books.google.co.jp/books?id=dX5P5mxtYYIC&pg=PA233&dq=phantom-fundamental+pitch+perception&lr=&as_brr=0&ei=ESCaR_m9DIfgswPHlMx9&sig=tbYP69o6YD3EPOqE-SOynLfMdhg&redir_esc=y&hl=ja }}</ref>。 ミッシング・ファンダメンタルに関して、[[ハイパスフィルタ|ロー・カット・フィルタ]]などにかけることによって、基本周波数成分を物理的には存在しないようにすることが可能である。近年では計算機の発達により、デジタル[[加算合成]]が簡易に可能となっており、物理的に完全に基本周波数成分を含まない[[複合音]]を合成出力することは精度高く可能になっている。 == ソフトウェアにおける音響心理学 == 心理音響モデルは、デジタル音声信号から安全に省ける部分を明らかにすることで、高品質な[[非可逆圧縮]]を可能にする。つまり、除去されても知覚に影響を与えない音の要素がわかる。 例えば、静かな場所では[[拍手]]は明瞭に聞こえるが、都会の交通量の多い交差点では拍手に気づくのも困難である。このような聴覚の性質を応用することで、圧縮比を向上させることができ、心理音響モデルに基づいた手法で、音声ファイルは 1/10 から 1/12 のサイズに圧縮しても高品質な再現性を維持できる。このような圧縮法は、最近のほとんどの[[音声圧縮]]フォーマットで使われている。例えば、[[MP3]]、[[Ogg Vorbis]]、[[Windows Media Audio|WMA]]、[[ATRAC]]などがある。 耳には上述したような知覚的限界がある。そのため、圧縮にあたっては、人間の可聴域外の音には低い優先順位を与える。つまり、ビット群を重要な成分に多く割り当て、重要でない成分にはビット数を少なく割り当てる。これによって、高品質の音声を保持しているように聞こえる圧縮アルゴリズムが構成される。 == 音響心理学と音楽 == 音響心理学に関連する分野として[[音楽心理学]]と呼ばれるものがある。Benjamin Boretz などの理論家は、音響心理学の一部の成果は音楽でのみ意味があるとしている{{要出典|date=2011年2月}}。 == 応用 == 音響心理学は各種領域に応用されている。ソフトウェア開発では、音楽再生システムの設計に数学的に証明されているパターンや実験的なパターンが使われている。軍事分野では、[[対人兵器]]として[[音響兵器]]が研究されている<ref>[http://www.nationaldefensemagazine.org/issues/2002/Mar/Acoustic-Energy.htm Acoustic-Energy Research Hits Sour Note] Roxana Tiron、2002年3月</ref>。音楽業界でも、特定の周波数をマスキングしたり、別の周波数を強調したりといった技法が用いられている。また、小型のスピーカーや低周波数のスピーカーの設計に[[#ミッシングファンダメンタル]]現象を使い、実際には再生できないほど低い周波数の音を再現できるようにしている。 == 脚注 == {{Reflist}} == 参考文献 == * E. Larsen and R.M. Aarts (2004), [http://www.dse.nl/~rmaarts/ Audio Bandwidth extension. Application of Psychoacoustics, Signal Processing and Loudspeaker Design.], J. Wiley. * E. Larsen and R.M. Aarts (2002), [http://www.extra.research.philips.com/hera/people/aarts/papers/aar02n4.pdf Reproducing low-pitched signals through small loudspeakers], J. Audio Eng. Soc., March, 50 (3), pp. 147–164. *{{cite|和書|editor=音の百科事典編集委員会|title=音の百科事典|year=2006|publisher=丸善|isbn=4-621-07660-4|ref={{sfnref|『音の百科事典』|2006}} }} *{{cite|和書|author=清水響|title=一般音楽論|year=2021|publisher=リットーミュージック|ref={{sfnref|清水『一般音楽論』|2021}} }} *{{cite book|和書|title=電気音響振動学|author=西巻正郎|series=電子通信大学講座|volume=9|edition=改版|publisher=コロナ社|date=1978-02|isbn=4-339-00076-0|ref={{SfnRef|電気音響振動学|1978}} }} *{{cite|和書|author=山本剛夫|author2=高木興一|title=環境衛生工学|publisher=朝倉書店|year=1988|isbn=4-254-26123-3|ref={{SfnRef|山本・高木『環境衛生工学』|1988}} }} == 関連項目 == * [[等ラウドネス曲線]] * [[音の大きさ]] * [[調律]] * [[音声認識]] * [[音色]] * [[カクテルパーティー効果]] * [[音響心理]] * [[知覚符号化]] * [[精神物理学]] * [[両耳聴効果]] == 外部リンク == * [http://www.newmusicbox.org/article.nmbx?id=4077 The musical ear - Perception of sound] * [http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=8178525&dopt=Abstract Applied psychoacoustics in space flight - Simulation of free field hearing by head phones] * [http://lame.sourceforge.net/gpsycho.php GPSYCHO - an open source psycho-acoustic and noise shaping model for ISO based MP3 encoders.] * [http://www.audiodesignline.com/howto/audioprocessing/175800470 How audio codecs work - Psycoacoustics] *NTT. [http://illusion-forum.ilab.ntt.co.jp/missing-fndamental/index.html ミッシング・ファンダメンタル]. **ミッシングファンダメンタル音声・スペクトログラムと解説 {{音響学}} {{データ圧縮}} {{Normdaten}} {{DEFAULTSORT:おんきようしんりかく}} [[Category:聴覚]] [[Category:音響]] [[Category:音響学]] [[Category:心理学]] [[Category:精神物理学]] [[Category:知覚]]
このページで使用されているテンプレート:
テンプレート:Cite
(
ソースを閲覧
)
テンプレート:Cite book
(
ソースを閲覧
)
テンプレート:Lang-en
(
ソースを閲覧
)
テンプレート:Main
(
ソースを閲覧
)
テンプレート:Normdaten
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:Sfn
(
ソースを閲覧
)
テンプレート:データ圧縮
(
ソースを閲覧
)
テンプレート:仮リンク
(
ソースを閲覧
)
テンプレート:参照方法
(
ソースを閲覧
)
テンプレート:要出典
(
ソースを閲覧
)
テンプレート:音響学
(
ソースを閲覧
)
音響心理学
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報