構造方程式モデリング（ＳＥＭ）の基本的な考え方 - 児童虐待の専門職が心理学や統計学を語るブログ

構造方程式モデリング（ＳＥＭ）は、多変量解析と呼ばれる統計手法群の1つですが、この手法の特徴は柔軟なモデル構成力にあります。

ある概念を測定したいと心理検査を構成した際に、その概念の下位にある要素間の関係性や概念に対して要素がどのように影響しているか、などを確認する手法です。

ＳＥＭの特徴としては他に、「構成概念f」と「観測変数x」があります。観測変数というのは実際の尺度項目、構成概念は実際にある項目ではないですが観測変数により確認された仮想的な変数です。

数学、英語、国語という科目が観測変数、学力が構成概念、という感じです。

ＳＥＭは研究論文などでなんとなく見たことある方も多いとは思いますが、

その指標（パス係数とか、独自分散とか）がどのように測定されているのか
モデルの適合度がどのように計算されているのか

といったところは正直よく分からず見ている方が多いのではないでしょうか。

せっかくなので、以下の図を例に解説していければと思います。

図（考え方を簡単にするため簡略化）

f:id:romancingsame:20190922164548g:plain

e:独自変数…観測変数の固有にもっている変数で、構成概念ではカバーできない範囲

v:観測変数…実際に測定したもの

f:構成概念…観測変数に影響を与えている概念

a:影響指標・因子負荷・パス係数etc…構成概念から観測変数への影響力の強さ

この図の場合、３つの測定方程式が立てられます。

v1=a1*f1+e1

v2=a2*f1+e2

v3=a3*f1+e3

と表現されます。モデルを分かりやすくするため、（本来はそんなことないんですけど）基本的な「学力」で説明しきれない個々のテストの成績は互いに無相関、ということにして、

Ｅ[eiej]=0 (i≠j)

と仮定します。

観測変数の共分散と測定方程式の母数との関係を記述すると(途中式省略)

σ1²=E[v1²]=a1²+σ_e1²

と表現されます。同様に

σ2²=a2²+σ_e2²

σ3²=a3²+σ_e3²

となります。次にv1とv2の共分散は(途中式省略)

σ21=E[v2v1]=a2a1

σ31=a3a1

σ32=a3a2

が導かれます。

観測変数の共分散行列の要素がこれで全て揃いました。以下に整理すると

f:id:romancingsame:20190922164657g:plain

と構造化して書き直すことができます。上のように共分散を方程式モデルの母数で表現したものを「共分散構造」といいます。

この共分散構造行列がＳＥＭの係数導出等の基本になるものでして、具体的な集計データからこの共分散構造行列にあてはめ、観測変数の標本共分散行列を構成して、最終的な係数等があてはめられたモデルが作られていくという感じです。

次に、パス係数や因子負荷などの推定量の導出です。

a1=±√(σ21σ31)/σ32 が得られます。a1が導出できれば残りの係数も導出できます。

a2=σ21/a1

a3=σ31/a1

誤差分散は

σe1²=σ1²-a1²

σe2²=σ2²-a2²

σe3²=σ3²-a3²

より導出されます。

その後、分散が１に標準化された「標準化モデル」により、モデルを解釈しやすい形に数値を変換する、などの作業を行ったりします。

以上のようにＳＥＭは、潜在した共通原因のために観測変数の間に相関が生じる現象を表現した「測定方程式モデル＝因子分析モデル」から共分散行列を構成し、その共分散行列を利用して測定方程式モデルの母数の推定量を導出することで、各観測変数や潜在変数（構成概念）の関係性をモデルで表現するものといえます。

ＳＥＭのパスとかって一体どこから出てくるんだろうとか思っていた時期がながくありましたが、この共分散行列に由来していたんですね。

こうやって作られたモデルの適合度を測定する指標は色々ありますが

ＳＥＭで使用するものとしてはＲＭＳＥＡとか、我らが赤池先生の考案したＡＩＣとかが有名でしょうか。

ＲＭＳＥＡはＳＥＭに特化して、モデルの分布と真の分布との乖離を、１自由度当たりの量として表現した指標になります。

RMSEA=√max((fML/df)-(1/N-1),0)　※fML=最尤法の目的関数、df=自由度

0.05以下であればあてはまりが良く、0.1以上であれば当てはまりが悪いとすることが多いように思われますが、この数値自体に根拠があるわけではないので注意。

ＡＩＣ＝χ²-2df

尤度で定義された統計モデルの良さを測定するために使用され、数値が小さいほど良いモデルだと判断されます

なお、χ²＝(N-1)fMLで定義され、適合が悪いほど値が大きくなります。カイ自乗値（検定統計量）はより小さく、p値はより大きなものであることが望ましいといえます。値そのものを適合度の指標として用いるよりは、「モデルはデータに適合している」という帰無仮説を検定するための検定統計量として用いられます。サンプルサイズが大きければ得られるp値も大きくなります（つまり第1種の誤りの確率が高くなる）が、ＳＥＭではそもそもサンプルサイズの大きいデータを用いることが多いので、この検定結果に意味を求める感じではないです。

ＳＥＭの適合度指標については、星野・岡田・前田(2005)『構造方程式モデリングの適合度指標とモデル改善について：展望とシミュレーション研究による新たな知見』が詳しいのでそちらを参照に！