保科架風, 酒折文武, 藤越康祝

日本計算機統計学会第22回シンポジウム at 臨床研究情報センター

 

【概要】

多次元データの圧縮・特徴抽出手法である主成分分析では, データの主情報を表現する次元=主成分数の選択が重要となる. これに対し本研究では, オリジナルデータと圧縮データの”近さ”をデータ行列と圧縮行列間の類似度によって測ることで主成分選択のための統計量を定義し, 統計的仮説検定に適用するために極限分布を導出した. さらに, 極限分布の収束精度を高めるために近似オーダーの次数を高めた.