2012年7月
研究発表
2012年6月
研究発表
I. Hoshina and S. Konishi
International Society for Bayesian Analysis 2012 at Kyoto Terrsa Conference Center.
【概要】
Bayesian lasso は事後分布が解析的に陽にもとまらず, MCMC手法によって発生させた事後分布からのサンプルに基づいて事後分布や点推定値の推定を行う. しかし, Bayesian lasso の事後分布には平均の値が 0 から離れると分散が大きくなる傾向があり, これによって推定モデルが不安定となり, 予測精度に影響を与えてしまう. これに対し本研究では, より安定的な Bayesian lasso のMAP推定を行う方法の提案を行った.
2012年1月
論文
保科 架風(2012).
計算機統計学 Vol. 25, No. 2, 73-85 .
【概要】
回帰モデリングにおいて変数選択と回帰係数の推定を同時に行う(これをスパース性と呼ぶ)ことを可能とするスパースモデリング手法は, 高次元データから効率的に有益な情報を抽出する手法である. 一方, スパースモデリング手法とベイズモデリングとの関係性はよく知られており, 代表的なスパースモデリング手法である Lasso はガウス線形回帰モデルにおいて回帰係数にラプラス事前分布を設定したときのMAP推定量として解釈することが可能である. この関係から Lasso を完全にベイズモデリングの枠組みに拡張したものが Bayesian lasso である. しかし, Bayesian lasso による回帰係数の点推定値にはスパース性が欠落している. そこで本研究では, Bayesian lasso の点推定値にスパース性を付与する推定アルゴリズムを提案した.
2011年12月
研究発表
保科架風
科研費シンポジウム「非正則統計的推測とその応用:想定内と想定外」at 東海大学
【概要】
Sparse 性を有することでモデルの推定と変数選択を同時に行うことが可能な Lasso をベイズモデルに拡張した Bayesian lasso には, Sparse 性の欠如という問題があり, 推定した回帰係数が厳密にはゼロにならない. 本研究では, この問題を解決するための推定アルゴリズムの導出過程について説明し, また, 他のスパースモデリングを推定するアルゴリズムについて紹介した.
2011年11月
研究発表
I. Hoshina and S. Konishi
日本計算機統計学会第25 回シンポジウム at Haeundae Grand Hotel
【概要】
代表的なスパースモデリング手法である Lasso には回帰係数ベクトルの幾つかの成分を厳密にゼロに推定する性質(=スパース性)が存在し, モデルの推定と変数選択を同時に行うことが可能である. しかし, Lasso をベイズモデリングの枠組みに拡張した Bayesian lasso は, 回帰係数のベイズ信頼区間やベイズ予測分布を獲得することを可能とする一方, スパース性が存在しないことが知られている. そこで本研究では, Bayesian lasso の点推定値にスパース性を付与する推定アルゴリズムを提案し, 数値実験によって提案アルゴリズムの特徴の検証を行った.
2011年9月
研究発表
保科架風, 小西貞則
2011年度統計関連学会連合大会 at 九州大学
※コンペティション最優秀報告賞を受賞
【概要】
回帰モデリングにおいて変数選択と回帰係数の推定を同時に行う(これをスパース性と呼ぶ)ことを可能とするスパースモデリング手法は, 高次元データから効率的に有益な情報を抽出する手法である. 一方, スパースモデリング手法とベイズモデリングとの関係性はよく知られており, 代表的なスパースモデリング手法である Lasso はガウス線形回帰モデルにおいて回帰係数にラプラス事前分布を設定したときのMAP推定量として解釈することが可能である. この関係から Lasso を完全にベイズモデリングの枠組みに拡張したものが Bayesian lasso である. しかし, Bayesian lasso による回帰係数の点推定値にはスパース性が欠落している. そこで本研究では, Bayesian lasso の点推定値にスパース性を付与する推定アルゴリズムを提案した.
2010年5月
研究発表
保科架風, 酒折文武
応用統計学会2010年度年会 at 統計数理研究所
※優秀ポスター発表賞を受賞
【概要】
1990年代以降, 次元圧縮・特徴抽出手法である主成分分析の様々な拡張手法が提案された. 例えば, 非線形な特徴を捉えることに優れたカーネル主成分分析や, 主成分軸を一部の重要な変数のみで構成するスパース主成分分析などである. これらの手法では, 主成分数の選択の他に, 調整パラメータの値を適切に選択する必要がある. そこで本研究では, オリジナルのデータ行列と種々の手法で圧縮された特徴行列との類似度がこれらの選択問題に適用可能であることを示した.
2010年3月
研究発表
保科架風
日本学術振興会日露共同研究プロジェクト Stochastic Analysis of the Advanced Statistical Models による研究集会 at 広島大学
【概要】
主成分分析における圧縮次元=主成分数の選択において提案した RV 統計量に対し, その標本分布を極限分布やBootstrap 分布で導出した際の精度について数値的に比較を行った. また, 提案した統計量がカーネル主成分分析における種々の決定問題に適用可能であることを報告した.
2010年3月
研究発表
松岡修平, 保科架風, 酒折文武
第7回大規模データ科学に関する研究会 at 北海道大学情報基盤センター
【概要】
一般的な数値データではなく, 区間データや分布データを扱うシンボリックデータ分析の分野において, それらデータから有益な情報を抽出するために多変量解析手法を適用することが求められる. しかしながら, 数値データに対して開発された多変量解析手法のシンボリックデータへの適用には問題が発生することが多い. 本研究では区間データの主成分分析において, 既存手法による圧縮区間データの幅が元データに比べて増大し解釈が困難になる問題に対し, 新たに区間データの主成分圧縮について定義し, さらに非線形な主成分分析であるカーネル主成分分析への拡張を行った.
2009年5月
研究発表
保科架風, 酒折文武
日本計算機統計学会第23回大会 at 福岡女子大学
【概要】
データ圧縮・特徴抽出手法である主成分分析における主成分数の選択問題のために提案した統計量に対し, 高次のオーダーで導出した極限分布であっても収束精度には限界が見られた. そこで本研究では計算機統計学の手法である Bootstrap 法(Percentile 法)とその改良手法( BCa法)を統計量の分布の導出に適用し, 既存研究である極限分布との間の精度の比較を行った. また, 提案した主成分数選択のための統計量を画像圧縮問題に適用し, 圧縮画像とオリジナル画像の近さを評価できることを示した.
I. Hoshina and S. Konishi
Joint Statistical Meeting 2012 at San Diego Convention Center
【概要】
Lasso では, モデル選択基準において推定バイアスに対応するモデルの有効自由度が解析的に陽に定まらず, モデルの有効自由度の不偏推定量をモデル選択基準に代入することが一般的である. これに対し本研究では, lasso の推定アルゴリズムの1つであるLARSアルゴリズムの特性に着目し, lasso の有効自由度をlassoの推定と同時に推定するアルゴリズムの提案を行った.