因子分析における因子の回転について
心理統計については学部時代に清水和秋先生に学んだこともあり、わりと古典的な手法が好きだったりします。
↓清水和秋教授のサイト。誰にも媚びない孤高の人物像を体現したサイトである。
http://www2.itc.kansai-u.ac.jp/~shimizu/chap0.html
古典的な手法、例えば因子分析がそうです。
今は↓の因子分析の本を読んでいるところなんですが、数学が得意でない文系人間な自分的にはスムーズに読めないのがつらいところ・・・。でも原理的な部分を勉強できて大変参考になります。
http://www.asakura.co.jp/books/isbn/4-254-12543-7/
因子分析と感覚的に似ているものに主成分分析があります。
主成分分析と因子分析の違いがイマイチ理解できないまま学部時代を過ごしかけた記憶がありますが、
主成分分析については以下のサイトが非常にわかりやすいです。
https://logics-of-blue.com/principal-components-analysis/
因子分析については、個人的によく勉強させていただいている清水裕二先生のサイトがわかりやすく詳しいです。後述。
因子分析を大学のSPSSとかでやった時を思い出すと、以下のような流れだったような気がします。
- 尺度を選定
- スクリ―基準等を用いたりして因子数を決定(主成分分析とか挟んだかも)
- 因子回転を決定(因子間が相関か無相関か、元の尺度に基づいて決定する)
- 因子共通性や因子負荷量を見て解釈
結果例)参考:清水・吉田(2008) Rosenberg自尊感情尺度のモデル化―wordingと項目配置の影響の検討― 関西大学『社会学部紀要』第39巻第2 号 より部分抜粋
※用語説明
・因子共通性:共通性が大きい項目は,共通因子から大きな影響を受けているという(独自因子の影響力が少ない)ことになる。一方で共通性が小さな項目は、共通因子からあまり影響を受けていない(独自因子の影響力が大きい)ということになる。
・因子負荷量=主成分と各項目との相関係数。因子負荷量が1か-1に近い因子ほど主成分により寄与していることになる。因子の解釈を行う際には,回転後の因子負荷量をみる。.40前後以上を示す因子負荷量を1つのまとまった因子と解釈したりする、とか。
・因子寄与率:各因子の寄与(各因子により説明される変数の分散の大きさで、因子kの変数1への寄与、と呼ばれる)を寄与の総和(全変数の分散の総和のうち共通因子により説明された分散の総和)で割った値。その因子が全体分散のうちどのくらい説明をしているかを示す指標。
多分この流れの中で、多くの人がいまひとつ意味わからず通り過ぎていたのって「回転」なんじゃないかと思います。
研究発表とかではいまだに同概念2因子で他の理由とかなくバリマックス回転とか見ますし、
どういう場合にどの回転ってのは知ってても、そもそも回転の原理って何だってのは私もよくわからんまま生きてきた時間が長かったです。
1.そもそもどうして因子を回転するの?
単純には、結果の解釈をしやすくするためです。
2.因子回転の解釈ってどうするの?
最初は各因子の意味や潜在変数の性質などは分かりませんよね。単に似たような項目が並んでいるテストだな~程度だと思います。その「似た」というのが感覚的には1つの因子になります。各項目が何か共有している特徴があり、それを因子という仮説にはめていく感じでしょうか。
分析の内容としては、因子パターン行列を推定した後に、その行列の各要素の因子負荷量の値で各因子がどういう性質をもった潜在変数なのかを明らかにすることが、因子の解釈です。解釈は基本的に、解釈しやすいよう因子の回転を行います。解釈しやすい因子は単純構造を持つとか言われますよね。
3.因子の回転ってどんなのがあるの?
a.オーソマックス回転=因子間相関を想定しない、直行回転
a-1:コーティマックス基準:回転後の因子パターンの要素における、全体の分散ないし行ごとの分散の和の最大化を図ったもの
a-2:バリマックス基準:回転後の因子パターンの要素における、列ごとの分散の和の最大化を図ったもの
b.オブリミン回転:回転後の因子パターンの要素における、列間の共分散の和の最小化を図ったもの。各項目がそれぞれ違う因子に負荷することを図ります。
c.プロクラテス回転:因子パターン行列または因子構造に関する仮説が存在するとき、その仮説行列と因子パターン行列または因子構造行列とのズレの最小化を図ったもの。仮説行列に近づけるために元の因子パターン行列等を回転させる回転行列を求める方法と言い換えられる。
c-2.プロマックス法:得られた行列にバリマックス回転を施した因子負荷行列を3~4乗した因子負荷行列を用い、斜交プロクラテス回転を行うもの。※プロマックス回転は計算の速さが売りだが真の解に一致しないことがあり、あくまで簡便な方法として用いるべき。
d.オーソブリク回転:因子の分散をすべて1に基準化した状態で直行回転を行うもの。
プロマックス回転やバリマックス回転は、いわゆる特定の回転基準を設定するもの。プロクラテス回転は別の因子負荷行列(例えば先行研究で得られた因子負荷行列)とのズレを小さくするように解を求めるもの、と言い換えることができます。
参考:清水裕士先生のHP「因子分析における因子軸の回転法について」
私たちが使用する際は、因子間相関を想定しないから直行回転、因子間相関を想定する尺度だから斜交回転、くらいのものだと思いますが、こうやって色々勉強してみると非常に深い話なんだろうな~と感じます。
なんとなく面白そうなんですが、回転の基本原理から始まり、各回転法の原理などを数式で追っていると、「ほんとに理解できてんのだろうか」という不安にかられ、やっぱりちゃんと分かってなかったんだ!と後で分かるという悲しい感じになりまくります。
とはいえ、因子分析は多大な情報を集約して抽象化する手法ともいえますので、数学的なエレガントさを備えた魅力的な技法だと常々感じています。もっと勉強したいな~。