雑音のある通信路モデルのソースを表示
←
雑音のある通信路モデル
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
'''雑音のある通信路モデル'''(ざつおんのあるつうしんろモデル、{{lang-en|noisy channel model}})は、[[スペルチェッカ]]、[[質問応答システム]] 、[[音声認識]]、[[機械翻訳]]に使用されるフレームワークである。このモデルでは、何らかの形で文字が乱されている単語から、意図した単語が何であるかを見つけることが目的である。 == 定義 == アルファベット <math>\Sigma</math> が与えられたとき、<math>\Sigma^*</math> を <math>\Sigma</math> による全ての有限文字列の集合とし、有効な単語からなる辞書 <math>D</math> を <math>\Sigma^*</math> の部分集合(すなわち <math>D\subseteq\Sigma^*</math> )とする。 '''雑音のある通信路'''は行列 :<math>\Gamma_{ws} = \Pr(s|w)</math>, である。ここで、<math>w\in D</math> は意図した単語、<math>s\in\Sigma^*</math> は実際に受信された乱された単語である。 == 例 == 英語のアルファベット <math>\Sigma = \{a, b, c, ..., y, z, A, B, ..., Z, ...\}</math> を考える。いくつかの部分集合 <math>D\subseteq\Sigma^*</math> は、有効な英語の単語の辞書を構成する。 入力中に、以下のような間違いが発生する可能性がある。 # 文字の脱落(例: ''letter''が''{{notatypo|leter}}''になる) # 文字の追加(例: ''mistake''が''{{notatypo|misstake}}''になる) # 文字の入れ替え(例: ''received''が''{{notatypo|recieved}}''になる) # 文字の置換(例: ''finite''が''{{notatypo|fimite}}''になる) 雑音のある通信路行列 <math>\Gamma</math> を構築するには、与えられた意図した単語(全ての <math>w\in D</math> と <math>s\in\Sigma^*</math> についての <math>\Pr(s|w)</math>)について、それぞれの間違いの確率を考慮する必要がある。これらの確率は、<math>s</math> と <math>w</math> の間の[[レーベンシュタイン距離]]を考慮して、あるいは、エッセイの草稿と手作業で綴りを編集したものとを比較することによって、集めることができる。 == 誤り訂正 == 雑音のある通信路モデルの目標は、受信した乱された単語から、意図した単語を見つけることである。'''決定関数 ''' <math>\sigma : \Sigma^* \to D</math> は、乱された単語を与えると、目的の単語を返す関数である。 決定関数を構成する方法には、[[最尤推定|最尤推定法]]、[[最大事後確率|最大事後法]]、{{仮リンク|最小距離推定|en|minimum distance estimation|label=最小距離法}}がある。 乱された単語をそのまま意図した単語として受け入れる方が、辞書内の目的の単語を見つけようとするよりも良い場合もある。 たとえば、schönfinkeling([[カリー化|currying]]の別名)という単語は辞書にないかもしれないが、実際には意図された単語かもしれない。 == 関連項目 == * [[符号理論]] == 出典 == {{Refbegin}} * {{cite journal | last1 = Brill | first1 = Eric | last2 = Moore | first2 = Robert C. | title = An Improved Error Model for Noisy Channel Spelling Correction |date=Jan 2000 | journal = Proceedings of ACL 2000 | url = http://www.aclweb.org/anthology/P00-1037 }} {{Refend}} {{デフォルトソート:さつおんのあるつうしんろもてる}} [[Category:自動認識およびデータ取得]] [[Category:応用言語学]] [[Category:自然言語処理]]
このページで使用されているテンプレート:
テンプレート:Cite journal
(
ソースを閲覧
)
テンプレート:Lang-en
(
ソースを閲覧
)
テンプレート:Notatypo
(
ソースを閲覧
)
テンプレート:Refbegin
(
ソースを閲覧
)
テンプレート:Refend
(
ソースを閲覧
)
テンプレート:仮リンク
(
ソースを閲覧
)
雑音のある通信路モデル
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報