項目反応理論と段階反応モデル - 児童虐待の専門職が心理学や統計学を語るブログ

項目反応理論（ＩＲＴ）による分析のモデルの１つに段階反応モデルがあります。

段階反応モデルってなあに？

「はい」「いいえ」のような2値反応ではなく、「はい」「どちらでもない」「いいえ」のような3つ以上の順序尺度的な反応を求められる課題があるとします。それをＩＲＴの枠組みの中で分析する方法が、段階反応モデルになります。

やや小難しい説明になりますが

段階反応モデルでは、項目 j（=1, …, J ; J は項目数）の反応ujがC個の値をとる順序尺度の離散変数であると仮定します。

以下に、課題a~eの得点を、３つの順序尺度で得点化したデータがあるとします。たとえば、「a. 算数より国語の方が好きだ　いいえ＝０、どちらでもない＝１、はい＝２」「b. 算数より国語の方が高得点の傾向にある　いいえ＝０、どちらでもない＝１、はい＝２」のような質問紙があるとして、以下のように記入してもらうという感じです。

　　　a　b　c　d　e

Ａ君　1　2　3　2　3

Ｂ君　3　3　3　2　3

Ｃ君　1　2　1　1　2

Ｄ君　1　1　2　2　1

Ｅ君　3　1　3　2　3

Ｆ君　2　1　3　2　3

Ｇ君　3　3　3　2　3

Ｈ君　1　3　3　2　3

・

このデータを、段階反応モデルを用いた項目反応理論による分析を行うとします。

結果と解釈は以下のようになります。

各課題を、いいえ＝０、どちらでもない＝１、はい＝２として３カテゴリの順序尺度とし、MCMCによるIRT段階反応モデルのパラメータ推定を実施。

f:id:romancingsame:20191218232221p:plain 、

その結果

課題４は、困難度の観点で見ると、b「４，１」とb「４，２」の差が最も大きい。これは中間に位置するカテゴリ（１点）に反応する確率が最も高いことを示しており、すなわち偶然正答の「１」の可能性の高さが示されている困難度の差が最も大きく「どちらでもない」の可能性が最も高い課題であることが示された。

課題１は適切な困難度かつ、偶然正答の「１」の可能性も最も低く、個人特性を最も識別する課題であることが示された。

課題３、課題５については、困難度の最下位(b[3,1]b[5,1])、最上位(b[3,2]b[5,2])が負の域に入っていることから、困難度の低い課題、すなわち平均以下の個人特性でも正答する率が高い傾向にある課題であることが示された。

各課題の特性を検討するには項目反応理論は有用で、段階反応モデルはその拡張版といえます。

個人的には、検査をある種質的な観点で解釈できる分析手法として好んで用いています。でも使いこなせているかはまた別の話…。

本解析で用いたＳｔａｎコードはこちら。

data{

int ni;

int nj;

int nc;

real D;

int<lower=1,upper=3> y[ni,nj];

}

parameters{

vector[nj] a;//識別力母数

ordered[nc-1] ba[nj];//困難度母数

vector[ni] theta;//回答者の特性値

}

transformed parameters{//項目反応カテゴリ特性曲線の定義を用いる

real b[nj,nc];

vector<lower=0,upper=1>[nc-1] pa[ni,nj];

simplex[nc] p[ni,nj];

for (j in 1:nj){

for (c in 1:nc){

if (c ==1){//もしｃが１(最下位カテゴリなら)

b[j,c]<-ba[j,c];

}else if (c ==nc){//cがnc(最上位カテゴリ)なら

b[j,c]<-ba[j,c-1];

}else{//cが上2つ以外なら

b[j,c]<-(ba[j,c-1]+ba[j,c])/2;

}

for (i in 1:ni){//i:1～ni

for (j in 1:nj){//j:1～nj

for (c in 1:nc-1){//c:1～nc-1

pa[i,j,c]<- 1/(1+exp(-D*a[j]*(theta[i]-ba[j,c])));

}

for (i in 1:ni){

for (j in 1:nj){

for(c in 1:nc){

if (c==1){

p[i,j,c]<-1-pa[i,j,c];

}else if(c==nc){

p[i,j,c]<- pa[i,j,c-1];

}else{

p[i,j,c]<- pa[i,j,c-1]-pa[i,j,c];

}

model{

for (i in 1:ni){

theta[i]~normal(0,1);

for (j in 1:nj){

y[i,j]~categorical(p[i,j]);//カテゴリカル分布：結果が3種類以上の状態を持つ施行が従う分布

}

for (j in 1:nj){

a[j]~lognormal(0,sqrt(0.5));

for (c in 1:nc-1){

ba[j,c]~normal(0,2);

}

このとき、一般的な項目反応理論の説明と同様に、潜在能力θの被験者がuj =cと反応する確率Pjc (θ)は、潜在能力θの被験者が uj≧cと反応する確率Pjc(θ) を用いて表現できます。

θを変数とみると段階反応モデルにおける項目jのカテゴリcの項目特性曲線を表しており、これは項目反応カテゴリ特性曲線（Item Response Category Characteristic Curve; IRCCC）と呼ばれます。

また、境界特性曲線（Boundary Characteristic Curve; BCC）は、θの値によらず

Pj0(θ)=1　・・・0より大きくなるのは確率1（１００％）

PjC(θ)=0　・・・Ｃより大きくなるのは確率０（０％）

です。