定義
- フィッシャー情報量(fisher information)とは
- パラメータによって決まる確率分布に対して、その分布に従う確率変数がそのパラメータ推定に関して有する「情報」の量を表す。確率変数Xが有する、パラメータに対するフィッシャー情報量をと表記し、Xの確率分布のスコア関数の分散として定義する。
特に、母数が多次元である場合、フィッシャー情報量はフィッシャー情報行列と呼ばれる実対称行列となる。
補足:スコア関数
- スコア関数とは
- 確率変数Xに対し、Xの確率密度関数の対数をパラメータで偏微分した関数をXのスコア関数と呼ぶ。
- 一般に、確率変数Xの確率密度分布関数がであるとき、確率密度分布関数にXを代入した値は、観測値Xに対する確率密度を表し、Xによって定まる確率変数となる。さらにの対数をとり、パラメータで偏微分した値、をスコア関数と定義する。スコア関数の性質として下記が成り立つ。
- パラメータを含まない任意のXの関数に対して下記が成り立つ。
-
- 証明:
-
- 期待値はゼロ
- 証明:上式でとおけば直ちに得られる。
- 証明:上式でとおけば直ちに得られる。
- 分散と2次中心モーメントは等しい
- 証明:
- なお、確率変数Xからなる式の期待値をとるという操作を行うと、確率変数Xは消えて代わりにパラメータの関数に変換される点に注意。
- パラメータを含まない任意のXの関数に対して下記が成り立つ。
補足:求め方
- Xの確率密度関数が母数を用いてだとすると、フィッシャー情報行列は、
- フィッシャー情報行列は、下記でも計算できる。
-
- は、の関数のヘッセ行列(の2階偏微分を成分にもつ行列)である。
- 証明)
- 正則条件(微分と積分が交換できる)のもとで確率の定義よりを満たすことを用いると、
- よって、
-
- なお、Xの確率密度関数が1次元の母数を用いてだとすると、上述の式は簡単になり下記が成り立つ。
性質
- Cramér–Rao(クラメール-ラオ)の不等式
- パラメータの任意の不偏推定量は以下のCramér–Rao(クラメール-ラオ)の不等式を満たす。これは即ちの分散共分散行列からフィッシャー情報行列の逆行列を引いた行列は、半正定値であることを表す。
- フィッシャー情報行列が対角行列である場合、パラメータベクトルの成分(=個々のパラメータ)は独立となり、Cramér–Rao(クラメール-ラオ)の不等式は、個々のパラメータの推定量の分散の下限を与える。
- パラメータの任意の不偏推定量は以下のCramér–Rao(クラメール-ラオ)の不等式を満たす。これは即ちの分散共分散行列からフィッシャー情報行列の逆行列を引いた行列は、半正定値であることを表す。
- 加法性
- 同一のパラメータを用いる2つの確率分布に従う独立な確率変数について、その同時確率分布の情報量は、
-
- 証明:
-
- 同一のパラメータを用いる2つの確率分布に従う独立な確率変数について、その同時確率分布の情報量は、
- 独立に同一の確率分布に従うn個の確率変数の同時確率分布の情報量
- 同一の確率密度関数に従うn個の独立な確率変数について、観測全体で得られる確率変数ベクトルをとする。Xが得られる確率は、の同時確率分布であるから、で表せる。
- ここで、確率変数をそれぞれスコア関数に代入して得られる確率変数(の関数となる)をとする。確率変数の情報量をとすると、
- すると、一般に独立な同一分布のn個の確率変数の標本平均について、nが十分に大きければ、中心極限定理より、は正規分布に収束するので、
- 即ち、
- 同様に大数の法則より、
パラメータ変換
- 確率変数、パラメータ、行列に対して、が正則であれば、
-
- 証明:
- 従って、
-
- 確率変数、パラメータ、行列に対して、が正則であれば、
- 従って、
最尤推定との関係
- 確率密度関数をもつ確率分布について、n回の観測結果によって得られる値を用いて、を推定する問題を考える。
- n回の観測結果で得られるそれぞれの結果を独立な確率変数で表し、観測全体で得られる確率変数ベクトルをとする。Xが得られる確率は、の同時確率分布であるから、で表せる。
- また、真のパラメータがである時、n回の観測で得られるフィッシャー情報量をと表記する。
- ここで、n回の観測結果を用いた最尤推定法による推定値をとする。最尤推定は一致性と漸近有効性を満たすことが分っているので、nが十分に大きければ、下記が成り立つ。
- ところで、は同じ同じ分布に従うので、そのフィッシャー情報量は等しく、その値はである。フィッシャー情報量の加法性を用いれば、下記が成り立つ。
- 従って、nが十分に大きければ、下記が成り立つ。
例
正規分布の場合
- 正規分布においては、
- 従って、
- よって、パラメータに対して、
多変量正規分布(分散固定)の場合
- n次元正規分布においては、
- 定義通り計算すると、
- もしくは、ヘッセ行列を用いてより簡単に、
- よって、分散を固定しのみをパラメータと考えた時は、
多変量正規分布(独立かつ等分散)の場合
- 分散共分散行列が独立かつ等分散すなわちである(1つのパラメータで表せる)場合、
- 従って、
- よって、パラメータに対して、
- なお、は成分がすべて0であるn次元ベクトル