ヒストグラムに基づくナイーブなモード推定量の性質について
概要
単峰の確率密度関数をもつ連続型確率変数に対し, モード (最頻値) はその最大確率密度をもつ変数の値として一意に定義される. モードは分布を代表する値であり, ベイズ推論などにおいても重要な意味を持つ.モードを推定する方法として様々なものがある. その 1 つに, 初等中等教育でも扱われるヒストグラムを用いる方法 (ナイーブモード推定量) がある. これは, ヒストグラムを作成した後に度数が最大となる階級の階級値を母集団モードの推定値とするものであるが, 階級のとりかたによってヒストグラムの様子が変わってしまうため, 推定値に影響が出てしまう. また, その推定量としての良さは明らかではない.
それ以外の推定量として, 例えば Bickel and Fruhwirth (2006) では Half Sample Mode (HSM) を提案した. 他には Anderews and Bickel (1972) は Shorth, Rousseuw (1987) は location of the Least Median of Squares (LMS) を提案した. これらの推定量は一致性や計算の速度などの観点から評価がなされている.
そこで, 本論文では, ヒストグラムによる分布推定とナイーブモード推定量との関係を概観する. 次に, その他の方法の例として HSM, Shorth および LMS を概説する. 最後に, ナイーブモード推定量の推定量としてのよさを検証するため, 数値比較をおこなう.