業績 - 研究発表

2011年11月

“Sparse Modifying Algorithm in Bayesian Lasso”

I. Hoshina and S. Konishi

日本計算機統計学会第25 回シンポジウム at Haeundae Grand Hotel

 

【概要】

代表的なスパースモデリング手法である Lasso には回帰係数ベクトルの幾つかの成分を厳密にゼロに推定する性質(=スパース性)が存在し, モデルの推定と変数選択を同時に行うことが可能である. しかし, Lasso をベイズモデリングの枠組みに拡張した Bayesian lasso は, 回帰係数のベイズ信頼区間やベイズ予測分布を獲得することを可能とする一方, スパース性が存在しないことが知られている. そこで本研究では, Bayesian lasso の点推定値にスパース性を付与する推定アルゴリズムを提案し, 数値実験によって提案アルゴリズムの特徴の検証を行った.

 

2011年9月

“Bayesian Lassos と変数選択”

保科架風, 小西貞則

2011年度統計関連学会連合大会 at 九州大学

※コンペティション最優秀報告賞を受賞

 

【概要】

回帰モデリングにおいて変数選択と回帰係数の推定を同時に行う(これをスパース性と呼ぶ)ことを可能とするスパースモデリング手法は, 高次元データから効率的に有益な情報を抽出する手法である. 一方, スパースモデリング手法とベイズモデリングとの関係性はよく知られており, 代表的なスパースモデリング手法である Lasso はガウス線形回帰モデルにおいて回帰係数にラプラス事前分布を設定したときのMAP推定量として解釈することが可能である. この関係から Lasso を完全にベイズモデリングの枠組みに拡張したものが Bayesian lasso である. しかし, Bayesian lasso による回帰係数の点推定値にはスパース性が欠落している. そこで本研究では, Bayesian lasso の点推定値にスパース性を付与する推定アルゴリズムを提案した.

2010年5月

“データ行列の類似度に基づく主成分数の選択”

保科架風, 酒折文武

応用統計学会2010年度年会 at 統計数理研究所

※優秀ポスター発表賞を受賞

 

【概要】

1990年代以降, 次元圧縮・特徴抽出手法である主成分分析の様々な拡張手法が提案された. 例えば, 非線形な特徴を捉えることに優れたカーネル主成分分析や, 主成分軸を一部の重要な変数のみで構成するスパース主成分分析などである. これらの手法では, 主成分数の選択の他に, 調整パラメータの値を適切に選択する必要がある. そこで本研究では, オリジナルのデータ行列と種々の手法で圧縮された特徴行列との類似度がこれらの選択問題に適用可能であることを示した.

2010年3月

“主成分数の選択に関するRV 統計量について”

保科架風

日本学術振興会日露共同研究プロジェクト Stochastic Analysis of the Advanced Statistical Models による研究集会 at 広島大学

 

【概要】

主成分分析における圧縮次元=主成分数の選択において提案した RV 統計量に対し, その標本分布を極限分布やBootstrap 分布で導出した際の精度について数値的に比較を行った. また, 提案した統計量がカーネル主成分分析における種々の決定問題に適用可能であることを報告した.

2010年3月

“区間データに対する主成分分析について”

松岡修平, 保科架風, 酒折文武

第7回大規模データ科学に関する研究会 at 北海道大学情報基盤センター

 

【概要】

一般的な数値データではなく, 区間データや分布データを扱うシンボリックデータ分析の分野において, それらデータから有益な情報を抽出するために多変量解析手法を適用することが求められる. しかしながら, 数値データに対して開発された多変量解析手法のシンボリックデータへの適用には問題が発生することが多い. 本研究では区間データの主成分分析において, 既存手法による圧縮区間データの幅が元データに比べて増大し解釈が困難になる問題に対し, 新たに区間データの主成分圧縮について定義し, さらに非線形な主成分分析であるカーネル主成分分析への拡張を行った.

 

2009年5月

“類似度に基づく主成分数の選択と画像解析への応用”

保科架風, 酒折文武

日本計算機統計学会第23回大会 at 福岡女子大学

 

【概要】

データ圧縮・特徴抽出手法である主成分分析における主成分数の選択問題のために提案した統計量に対し, 高次のオーダーで導出した極限分布であっても収束精度には限界が見られた. そこで本研究では計算機統計学の手法である Bootstrap 法(Percentile 法)とその改良手法( BCa法)を統計量の分布の導出に適用し, 既存研究である極限分布との間の精度の比較を行った. また, 提案した主成分数選択のための統計量を画像圧縮問題に適用し,  圧縮画像とオリジナル画像の近さを評価できることを示した.

2008年11月

“主成分の次元に関するRV検定統計量について”

保科架風, 酒折文武, 藤越康祝

日本計算機統計学会第22回シンポジウム at 臨床研究情報センター

 

【概要】

多次元データの圧縮・特徴抽出手法である主成分分析では, データの主情報を表現する次元=主成分数の選択が重要となる. これに対し本研究では, オリジナルデータと圧縮データの”近さ”をデータ行列と圧縮行列間の類似度によって測ることで主成分選択のための統計量を定義し, 統計的仮説検定に適用するために極限分布を導出した. さらに, 極限分布の収束精度を高めるために近似オーダーの次数を高めた.