因子分析のソースを表示
←
因子分析
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
{{脚注の不足|date=2020年2月}} {{Machine learning bar}} '''因子分析'''(いんしぶんせき、{{Lang-en-short|factor analysis}})は、分析対象を多数の項目で測定・評価したデータ(=観測データ)の連成を分析し、データの裏にある本質的な原因(=因子)を統計的に推定する[[多変量解析]]の手法のひとつ。 心理学における[[人格|パーソナリティ]]の[[特性論]]的研究など、心理尺度の研究手法として使用される。 モデル式の形状などから[[主成分分析]]と混同されることもあるが、[[主成分分析]]は観測データから合成スコアを構築することが目的であるのに対し、'''因子分析'''は観測データが合成量であると仮定し、個々の構成要素を得ようとすることが目的であり、両者は因果関係を異にする。 適用の例として「器用さ」の個人差の検討が考えられる。A, B, Cの3人はそれぞれ「ジグソーパズル」「彫刻」「時計の分解」をある速度で器用にこなすことができるとしたときにA, B, Cの器用さをどのように評価すればよいかを考える場合、3人が3つのテストにかかった時間に対して因子分析を適用することで、3つの課題に共通する潜在的な「器用さ」の導出を試みることができる。 因子分析では、因子数を事前に与える必要があるなど、数学的見地から理論的に疑義をはさむ意見もある一方、[[主成分分析]]が測定誤差を考慮要素に含めずに合成変量としている点を批判するなど、両者に関してともすれば[[宗教論争]]的な議論が絶えない。 いずれにせよ、[[データ解析]]における基本的心構えとして、算出された数値はあくまで計算によるものであり、それらの妥当性は研究者の判断に委ねられることは当然である、と理解しておく必要がある。 == 統計モデル == === 定義 === 今、<math>m</math>個の確率変数の組、<math>x_1,\dots,x_m</math>が得られたとする。また、各変数の母平均はそれぞれ<math>\mu_1,\dots,\mu_m</math>であるとする。 これらの変数を、p個の共通因子<math>f_1, \dots, f_p</math>で : <math>x_j - \mu_j = \lambda_{j1} f_1 + \lambda_{j2} f_2 + \dots + \lambda_{jp} f_p + \varepsilon_j \qquad (j=1, \dots, m)</math> と説明する線形モデルが因子分析法である。 ここで、<math>\lambda_{11}, \lambda_{12},\dots, \lambda_{m{p-1}}, \lambda_{mp}</math>は因子負荷量と呼ばれ,通常の多変量回帰分析における偏回帰係数に相当する。また、<math> \varepsilon_j \,</math>は変数<math>x_j\,</math>の独自因子と呼ばれ、通常の線形回帰モデルにおける観測誤差とは別の仮定がおかれる<ref group="注">独自因子を、特殊因子と観測誤差の和として説明することもできるが、通常のパラメータ推定仮定において特殊因子と観測誤差の分離は難しいため、ここでは独自因子とだけ述べる。</ref>。 先のモデルをベクトルと行列を用いて表すと<ref group="注">因子分析法には変量モデル、母数モデル、記述モデルの3種類が存在するが、ここでは変量モデルのみ述べる。</ref>、 : <math> \mathbf{x} - \boldsymbol{\mu} = \boldsymbol{\Lambda} \mathbf{f} + \boldsymbol{\varepsilon} </math> となる。以降、各種の仮定やモデルの性質はこちらを基本として説明する。 共通因子<math>\mathbf{f}</math>と独自因子<math>\boldsymbol{\varepsilon}</math>には * <math>\mathbf{f}</math> と <math>\boldsymbol{\varepsilon}</math>は統計的に独立 * <math>\mathrm{E}[\mathbf{f}] = \mathbf{0},\quad \mathrm{Var}[\mathbf{f}] = \boldsymbol{\Phi}</math> * <math>\mathrm{E}[\boldsymbol{\varepsilon}] = \mathbf{0},\quad \mathrm{Var}[\boldsymbol{\varepsilon}] = \boldsymbol{\Psi}</math>(<math>\boldsymbol{\Psi}</math>は対角行列; 異なる変数に対する独自因子は無相関) であるという仮定がおかれる。 この仮定を用いて,観測された変数<math>\mathbf{x}</math>の分散共分散行列を考えると : <math> \mathrm{Var}[\mathbf{x}] = \mathrm{E}[(\mathbf{x} - \boldsymbol{\mu})(\mathbf{x} - \boldsymbol{\mu})^t] = \boldsymbol{\Sigma} = \boldsymbol{\Lambda} \boldsymbol{\Phi} \boldsymbol{\Lambda}^{t} + \boldsymbol{\Psi} </math> となり、観測変数の分散共分散行列がパラメータ行列で構造化されていることがわかる。 ここでは分散共分散行列が構造化されると述べたが、通常のパラメータ推定手順においては観測変数 <math>\mathbf{x}</math> を前もって標準化しておくことで、分散共分散行列ではなく相関係数行列に上記の構造化を考える。 === 性質 === ==== 回転の不定性 ==== 因子分析モデルには回転の不定性と呼ばれる性質がある。これは、 <math> \begin{align} \mathbf{x} - \boldsymbol{\mu} &= \boldsymbol{\Lambda} \mathbf{f} + \boldsymbol{\varepsilon} \\ &= \boldsymbol{\Lambda} \mathbf{T}^{-1} \mathbf{T} \mathbf{f} + \boldsymbol{\varepsilon} \\ &= \tilde{\boldsymbol{\Lambda}} \tilde{\mathbf{f}} + \boldsymbol{\varepsilon} \\ \end{align} </math> のように、適当な行列<math>\mathbf{T}</math>を用いて変換した因子負荷行列<math>\tilde{\boldsymbol{\Lambda}}</math>と共通因子<math>\tilde{\mathbf{f}}</math>もまた因子分析モデルを(統計的な適合度を変えることなく)満たすという、解の不定性のことを指す。 == ソフトウェア == * [http://www.okada.jp.org/RWiki/index.php?R%A4%CE%B4%F0%CB%DC%A5%D1%A5%C3%A5%B1%A1%BC%A5%B8%C3%E6%A4%CE%C2%BF%CA%D1%CE%CC%B2%F2%C0%CF%B4%D8%BF%F4%B0%EC%CD%F7 Rの基本パッケージ中の多変量解析関数一覧] *: 統計解析ツール[[R言語]]は因子分析など多変量解析を標準で行えるフリーウェア。[[可視化]]機能に優れる。[[マルチプラットフォーム]]。他統計ソフトやExcelのファイル取込やODBC接続も可能。[[アメリカ食品医薬品局|FDA]]の申請にも使用を認められ、CRANという仕組みで世界の膨大なアプリケーションを無償で使える。 そのほか、SAS、SPSS等多くのソフトで因子分析を扱うことができる。 * [http://bm.hus.osaka-u.ac.jp/~harada/jikken/sas/ SASによる因子分析] [http://www.sas.com/ja_jp/industry/higher-education/fieldvoice/colum-asano/colum-asano-03.html 統計プログラムとのおつきあい] * [http://www.u-gakugei.ac.jp/~kishilab/spss-factoranalysis.htm SPSSで因子分析を行う] [http://www-06.ibm.com/software/jp/analytics/spss/analysis/f-analysis.html IBM 因子分析] ==注釈== <references group="注"/> == 関連項目 == * [[レコメンダシステム]] == 外部リンク == * [http://ebsa.ism.ac.jp/ebooks/ebook/353?tid=44 因子分析法通論(書籍)] * [http://www.sigmath.es.osaka-u.ac.jp/~kano/research/seminar/30BSJ/kano.pdf 主成分分析は因子分析でない!] * [http://www.sigmath.es.osaka-u.ac.jp/~kano/research/seminar/30BSJ/murakami.pdf 心理測定の立場から見た因子分析と主成分分析] * [http://www.ec.kagawa-u.ac.jp/~hori/yomimono/fnumber.ppt 因子数決定法,斜交回転法,階層因子分析] * [http://www.usq.edu.au/users/patrick/PAPERS/factor%203.pdf Evaluating the Use of Exploratory Factor Analysis in Psychological Research] {{Normdaten}} {{DEFAULTSORT:いんしふんせき}} [[Category:因子分析|*]] [[Category:次元削減]] [[Category:計量心理学]] [[Category:教育心理学]] [[Category:定量的マーケティング調査]] [[Category:プロダクトマネジメント]] [[Category:マーケットセグメンテーション]]
このページで使用されているテンプレート:
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Machine learning bar
(
ソースを閲覧
)
テンプレート:Normdaten
(
ソースを閲覧
)
テンプレート:脚注の不足
(
ソースを閲覧
)
因子分析
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報