ベクトル空間モデルのソースを表示
←
ベクトル空間モデル
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
'''ベクトル空間モデル'''とは[[情報検索]]を行うための[[アルゴリズム]]の一つ。ベクトル空間モデルによる検索は高次元のベクトル空間上に配置した検索対象のベクトル表現と検索語のベクトル表現の相関量を[[コサイン類似度]]、[[内積]]、[[距離]]等によって計算して関連度を求める。 ==メタデータ生成法== === 単語文書行列 === 単語文書行列とはメタデータの生成・表現法の一つであり、'''ベクトル空間モデル'''による検索を行う際に非常に頻繁に用いられるメタデータの形式である。一般に単語文書行列は以下に示す構造を持つ。 単語文書行列: <math> \mathcal{M} = \begin{pmatrix} & d_1 & d_2 & d_3\\ t_1 & 0 & 2 & 1\\ t_2 & 1 & 1 & 2\\ t_3 & 0 & 0 & 3\\ \end{pmatrix} </math> 文書''d<sub>i</sub>''に単語''t<sub>j</sub>''が''n''回出現するとき、''w<sup>i</sup><sub>j</sub>''を''n''とし、行列を形成する。単純に出現回数を利用する以外に[[tf-idf]]等のアルゴリズムによって得た重みを用いる生成方法がしばしば行われる。<!--tf-idfは下に示すように定義される。 tf-idf: {| |- |<math>\mathit{tfidf}^{d}_{t} = </math> |<math>\mathit{tf}^d_t\cdot \log\frac{N}{\mathit{df}_t} + 1</math> |- |<math>\mathit{tf}^d_t :</math> | |- |<math>\mathit{df}_t : </math> | |- |<math>N:</math> | |}--> == 関連項目 == * {{仮リンク|Bag-of-words|en|Bag-of-words}} * [[転置インデックス]] * [[最近傍探索]] {{DEFAULTSORT:へくとるくうかんもてる}} [[Category:アルゴリズム|へくとるくうかん]] [[Category:検索|へくとるくうかん]] [[Category:知識表現]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:仮リンク
(
ソースを閲覧
)
ベクトル空間モデル
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報