ゴリゴリ文系の自分が統計の勉強をしていて(^q^)となった概念シリーズ。
勉強のためにまとめたもの。
・同時確率
例えば、2つの変数XとYがあるとします。X=0,Y=1である確率をP(X=0,Y=1)で表し、これを同時確率と呼びます。いちばん基本的な同時確率の考え方です。
では次に、これを連続確率変数に変えて考えてみます。
a<X<bかつc<Y<dとなる確率は、P(a<X<bかつc<Y<d)と表現できます。
P(a<X<bかつc<Y<d)を同時確率と呼びます。
・同時確率密度関数
p(x,y)≧0
かつ
∬p(x,y)dxdy=1
を満たす関数によって、同時確率
P(a<X<b,c<Y<d)=∫(∫p(x,y)dx)dy を定義し、
p(x,y) を、X,Yの同時確率密度関数と呼びます。同時確率密度関数を図にすると、よく見る山みたいになっている三次元のあれです。つまり、f(x,y)のグラフは局面になります。1次元の確率密度関数f(x)をxの全区間で積分すると1になるのと同じで、f(x,y)はx,yの全区間で重積分すると1になります。
∬R2f(x,y)dxdy=1
これは、先述のよく見る山みたいになってる3次元のあれの体積が1であることに対応します。
複数の確率密度関数f(x1,x2,x3…xn)があって、x(1~n)の全区間で重積分をしたら1になる場合、f(x1,x2,x3…xn)を同時確率密度関数という、と言い換えられます。
・周辺確率
ただ一つだけの事象が起きる確率。例えば、Xの周辺確率とは、他の事象に関係なく、事象Xが発生する確率を指します。周辺確率は、周辺確率を求めたい事象とその他の事象の同時確率の総和で求められます。Xの周辺確率はP(X)、周辺確率密度関数は、f(X)と表記します。
・周辺分布(周辺確率分布)
同時分布から片方の変数を積分によって消去することで得る確率分布のことを周辺分布といいます。例えば2変量正規分布では、x(またはy)単独の事象に関する確率の分布のことです。確率変数(X,Y)の確率密度関数がp(x,y)である時にはこれを同時確率分布といいますが、これの周辺分布はそれぞれ
p(x)=∫p(x,y)dy
p(y)=∫p(x,y)dx
と、それぞれの確率分布によって定義されます。