2017年3月
論文
2016年9月
研究発表
保科架風
2016年度統計関連学会連合大会 at 金沢大学
【概要】
モデルの推定と変数選択を同時に行うことが可能なスパースモデリング手法において, 非凸関数を正則化項として持つ手法にはサンプルサイズが増加するにつれ真のモデルに収束する性質(Oracle Property)を持つものがいくつも存在する. しかし, それらの手法には複数の調整パラメータが存在し, 候補のモデルの増大に伴い, モデリングコストの増大とモデル選択の精度の向上が求められる. これに対し本研究では, one-step local linear approximation による Bridge の推定をベイズモデルで表現し, その上で2つある調整パラメータのうちの1つを回帰係数や誤差分散と同時推定し, 残りの調整パラメータの選択のためのモデル選択基準の導出を行った.
2016年2月
研究発表
保科架風
科研費シンポジウム「統計学と機械学習における数理とモデリング」at 東京工業大学
【概要】
非凸正則化手法である Bridge 回帰は, 真のモデルへの収束性(Oracle Property)を持つ手法として知られ, 理論的な魅力を持つ. しかしながら, 推定に非凸最適化問題を解く必要があり, また, 複数の調整パラメータの値を決定する必要がある. この問題に対し本研究では, ある調整パラメータを他のモデルパラメータと同時推定するために local linear approximation を適用した Bridge 回帰をベイズモデルに拡張し, 事後分布の単峰性を有するような事前分布を定め, 推定を効率的に行える手法の提案を行った. また, 残りの調整パラメータを選択するための問題について提示し, それらに対応する手法の提案を行った.
2015年11月
論文
I. Hoshina(2015).
Bulletin of informatics and cybernetics Vol. 47, 37-58.
【概要】
Lasso をベイズモデルに拡張した Bayesian lasso には事後分布の解析解を導出することが困難であるという問題がある. これに対し本研究では, Bayeisan lasso の階層モデルが尺度混合正規分布の形状になっていることに着目し, そこからモンテカルロ積分によって Bayeian lasso の事後分布が混合正規分布の形状で近似可能であることを示し, さらにNewton法によって Bayesian lasso の MAP 推定を行う手法を提案した.
2015年9月
研究発表
保科架風, 酒折文武
2015年度統計関連学会連合大会 at 岡山大学
【概要】
Lassoでは, 推定された回帰係数ベクトルと共に誤差分散の推定値を用いてモデル選択基準を求めることが多い. しかし, lasso には誤差分散の推定量が存在せず, 多くの研究では不偏推定量や最尤推定量を代用する. これに対し本研究では, 誤差分散の推定値によるlasso のモデル選択の精度に対する影響を数値的に検証し, また, モデル選択基準ごとに適切な誤差分散の推定値について考察を行った.
2015年9月
研究発表
保科架風
2015年度統計関連学会連合大会 at 岡山大学
【概要】
モデルの推定と変数選択の同時性を有する lasso と高次元データに対して安定的なモデイングを可能にする ridge の一般化として定義される bridge 回帰は, 柔軟なモデリングが可能である一方, モデル選択のコストや推定の難しさといった問題を抱える. これに対し本研究では, bridge 回帰のベイズモデルをもとに推定を行い, モデル選択のコストを低減させ, また, 容易に推定する手法の提案を行った.
2015年6月
論文
S. Kawano, I. Hoshina, K. Shimamura and S. Konishi (2015).
Journal of the Japanese Society of Computational Statistics Vol. 28, 67-82.
【概要】
代表的なスパースモデリング手法である lasso をベイズモデルに拡張した Bayesian lasso において, 回帰係数ベクトルに関する推定の信頼性はベイズ信頼区間によって評価することが可能である. しかしながら, Bayesian lasso のベイズモデルは事後分布・予測分布の closed form を導出することが困難な形状になっており, 事後分布の推定に Gibbs sampler を使用する. このため, 解析的に陽な形で推定モデルの精度を評価することも困難である. これに対し本研究では, Bayesian lasso の事前分布をカルバック・ライブラー情報量の意味において最も近い正規分布で近似することで, Bayeisan lasso の近似予測分布を定め, それに基づく予測情報量基準 aPIC の導出を行うことで, Bayesian lasso による推定モデルの精度評価を行うことを可能にした.
2014年3月
研究発表
保科架風, 小西貞則
第8回日本統計学会春季集会 at 同志社大学
※優秀発表賞を受賞
【概要】
本研究では高次元データに対して有効なモデリング手法として知られる elastic net に対するモデル選択基準の提案を行った. 一般に, モデル選択基準の多くは漸近的に予測精度を評価するものであり, 高次元データに対しては評価の精度が保証されなくなる. これに対し本研究で提案したモデル選択基準は, 漸近的な近似の代わりにモンテカルロ積分を適用し, 高次元データでも適切にモデルを評価することが可能である.
2013年11月
研究発表
保科架風
日本計算機統計学会第27 回シンポジウム at 崇城大学ホール
【概要】
種々のモデル選択基準でモデルの有功自由度は重要な役割を果たすが, Bayesian lasso におけるモデルの有功自由度についてはあまり研究が進められてこなかった. これは, Bayesian lasso のモデルが解析的に扱いづらく, 数値的な手法によって推定するのが一因である. これに対し本研究では, 数値計算を含むことによってBayesian lasso のモデルに対してモデルの有功自由度が容易にもとまることを示した.
2012年10月
研究発表
保科架風, 廣瀬慧, 小西貞則
科研費シンポジウム「統計科学における深化と横断的展開」 at 松江テルサ
【概要】
回帰係数を厳密にゼロと推定する性質=Sparse 性を有するスパースモデリング手法は, モデルの推定と同時に変数選択を行うことが可能であり, 高次元データから効率的に有益な情報を抽出することが期待されている. しかし, これらの手法のモデリングでは調整パラメータを適切な値に決定することが重要となるが, そのためのモデル選択基準のキーポイントとなる Degrees of Freedom は一般に未知である. この問題に対し本研究では, LARS アルゴリズムの理論的特性を活用した Degrees of Freedom の推定手法を提案し, さらにそれによって Lasso, Elastic net, Adaptive lasso などの Degrees of Freedom の推定が可能になることを示した.
酒折 文武, 圓城寺 啓人, 竹森 悠渡, 西塚 真太郎, 保科 架風(2017).
統計数理, To appear.
【概要】
野球の投手における肘内側側副靭帯の損傷は近年増加しており, 大きな問題となっている. 予防の重要性にもかかわらず, そのリスク要因に関する科学的なコンセンサスが得られているとは言い難い. そこで本論文では, 肘内側側副靭帯損傷のリスク要因の候補を再検討した. そして, 先発投手とリリーフ投手とに層別してそれぞれロジスティック回帰モデルを立て, AIC を用いた変数選択により選択されたリスク要因について, 調整オッズ比を算出した. その結果, 先発投手については, 球種数が少ないこと, リリース位置が体から横に離れていること, 1 試合当たりの投球数が多いことがリスク要因であることがわかった. またリリーフ投手に関しては, 球種数が少ないこと, リリース位置が体から横に離れていること, ファストボー ルの球速が速いこと, 登板間隔が短いことがリスク要因であることがわかった. これらの結果は, 他の研究成果の一部を肯定しているとともに, 先発投手やリリーフ投手における 1 試合の投球数や登板間隔に関する重要な示唆を与えているといえる.