業績 | ibuki aj hoshina

業績

2017年3月 論文: “野球のトラッキングデータに基づいた肘内側側副靭帯損傷の要因解析”

酒折文武, 圓城寺啓人, 竹森悠渡, 西塚真太郎, 保科架風(2017).

統計数理, To appear.

【概要】

野球の投手における肘内側側副靭帯の損傷は近年増加しており, 大きな問題となっている. 予防の重要性にもかかわらず, そのリスク要因に関する科学的なコンセンサスが得られているとは言い難い. そこで本論文では, 肘内側側副靭帯損傷のリスク要因の候補を再検討した. そして, 先発投手とリリーフ投手とに層別してそれぞれロジスティック回帰モデルを立て, AIC を用いた変数選択により選択されたリスク要因について, 調整オッズ比を算出した. その結果, 先発投手については, 球種数が少ないこと, リリース位置が体から横に離れていること, 1 試合当たりの投球数が多いことがリスク要因であることがわかった. またリリーフ投手に関しては, 球種数が少ないこと, リリース位置が体から横に離れていること, ファストボールの球速が速いこと, 登板間隔が短いことがリスク要因であることがわかった. これらの結果は, 他の研究成果の一部を肯定しているとともに, 先発投手やリリーフ投手における 1 試合の投球数や登板間隔に関する重要な示唆を与えているといえる.
2016年9月 研究発表: “Bay-Bridge: bridge 回帰におけるパラメータの同時推定とモデル選択基準”

保科架風

２０１６年度統計関連学会連合大会 at 金沢大学

【概要】

モデルの推定と変数選択を同時に行うことが可能なスパースモデリング手法において, 非凸関数を正則化項として持つ手法にはサンプルサイズが増加するにつれ真のモデルに収束する性質（Oracle Property）を持つものがいくつも存在する. しかし, それらの手法には複数の調整パラメータが存在し, 候補のモデルの増大に伴い, モデリングコストの増大とモデル選択の精度の向上が求められる. これに対し本研究では, one-step local linear approximation による Bridge の推定をベイズモデルで表現し, その上で２つある調整パラメータのうちの1つを回帰係数や誤差分散と同時推定し, 残りの調整パラメータの選択のためのモデル選択基準の導出を行った.
2016年2月 研究発表: “Bay-Bridge : local linear approximated bridge and its model building procedure via the Bayesian model”

保科架風

科研費シンポジウム「統計学と機械学習における数理とモデリング」at 東京工業大学

【概要】

非凸正則化手法である Bridge 回帰は, 真のモデルへの収束性（Oracle Property）を持つ手法として知られ, 理論的な魅力を持つ. しかしながら, 推定に非凸最適化問題を解く必要があり, また, 複数の調整パラメータの値を決定する必要がある. この問題に対し本研究では, ある調整パラメータを他のモデルパラメータと同時推定するために local linear approximation を適用した Bridge 回帰をベイズモデルに拡張し, 事後分布の単峰性を有するような事前分布を定め, 推定を効率的に行える手法の提案を行った. また, 残りの調整パラメータを選択するための問題について提示し, それらに対応する手法の提案を行った.
2015年11月 論文: “Sparse regression modeling via the MAP Bayesian lasso. “

I. Hoshina(2015).

Bulletin of informatics and cybernetics Vol. 47, 37-58.

【概要】

Lasso をベイズモデルに拡張した Bayesian lasso には事後分布の解析解を導出することが困難であるという問題がある. これに対し本研究では, Bayeisan lasso の階層モデルが尺度混合正規分布の形状になっていることに着目し, そこからモンテカルロ積分によって Bayeian lasso の事後分布が混合正規分布の形状で近似可能であることを示し, さらにNewton法によって Bayesian lasso の MAP 推定を行う手法を提案した.
2015年9月 研究発表: “Lasso の誤差分散の推定について”

保科架風, 酒折文武

２０１５年度統計関連学会連合大会 at 岡山大学

【概要】

Lassoでは, 推定された回帰係数ベクトルと共に誤差分散の推定値を用いてモデル選択基準を求めることが多い. しかし, lasso には誤差分散の推定量が存在せず, 多くの研究では不偏推定量や最尤推定量を代用する. これに対し本研究では, 誤差分散の推定値によるlasso のモデル選択の精度に対する影響を数値的に検証し, また, モデル選択基準ごとに適切な誤差分散の推定値について考察を行った.
2015年9月 研究発表: “ベイズモデルに基づくBridge 回帰モデリング”

保科架風

２０１５年度統計関連学会連合大会 at 岡山大学

【概要】

モデルの推定と変数選択の同時性を有する lasso と高次元データに対して安定的なモデイングを可能にする ridge の一般化として定義される bridge 回帰は, 柔軟なモデリングが可能である一方, モデル選択のコストや推定の難しさといった問題を抱える. これに対し本研究では, bridge 回帰のベイズモデルをもとに推定を行い, モデル選択のコストを低減させ, また, 容易に推定する手法の提案を行った.
2015年6月 論文: “Predictive model selection criteria for Bayesian lasso regression. “

S. Kawano, I. Hoshina, K. Shimamura and S. Konishi (2015).

Journal of the Japanese Society of Computational Statistics Vol. 28, 67-82.

【概要】

代表的なスパースモデリング手法である lasso をベイズモデルに拡張した Bayesian lasso において, 回帰係数ベクトルに関する推定の信頼性はベイズ信頼区間によって評価することが可能である. しかしながら, Bayesian lasso のベイズモデルは事後分布・予測分布の closed form を導出することが困難な形状になっており, 事後分布の推定に Gibbs sampler を使用する. このため, 解析的に陽な形で推定モデルの精度を評価することも困難である. これに対し本研究では, Bayesian lasso の事前分布をカルバック・ライブラー情報量の意味において最も近い正規分布で近似することで, Bayeisan lasso の近似予測分布を定め, それに基づく予測情報量基準 aPIC の導出を行うことで, Bayesian lasso による推定モデルの精度評価を行うことを可能にした.
2014年3月 研究発表: “Tuning parameter selection in elastic net regularization via the generalized Bayesian information criterion”

保科架風, 小西貞則

第８回日本統計学会春季集会 at 同志社大学

※優秀発表賞を受賞

【概要】

本研究では高次元データに対して有効なモデリング手法として知られる elastic net に対するモデル選択基準の提案を行った. 一般に, モデル選択基準の多くは漸近的に予測精度を評価するものであり, 高次元データに対しては評価の精度が保証されなくなる. これに対し本研究で提案したモデル選択基準は, 漸近的な近似の代わりにモンテカルロ積分を適用し, 高次元データでも適切にモデルを評価することが可能である.
2013年11月 研究発表: “ベイズ型L1 正則化法におけるモデルの有効自由度”

保科架風

日本計算機統計学会第27 回シンポジウム at 崇城大学ホール

【概要】

種々のモデル選択基準でモデルの有功自由度は重要な役割を果たすが, Bayesian lasso におけるモデルの有功自由度についてはあまり研究が進められてこなかった. これは, Bayesian lasso のモデルが解析的に扱いづらく, 数値的な手法によって推定するのが一因である. これに対し本研究では, 数値計算を含むことによってBayesian lasso のモデルに対してモデルの有功自由度が容易にもとまることを示した.
2012年10月 研究発表: “LARS に基づくL1 正則化法におけるモデル選択基準の構成”

保科架風, 廣瀬慧, 小西貞則

科研費シンポジウム「統計科学における深化と横断的展開」 at 松江テルサ

【概要】

回帰係数を厳密にゼロと推定する性質＝Sparse 性を有するスパースモデリング手法は, モデルの推定と同時に変数選択を行うことが可能であり, 高次元データから効率的に有益な情報を抽出することが期待されている. しかし, これらの手法のモデリングでは調整パラメータを適切な値に決定することが重要となるが, そのためのモデル選択基準のキーポイントとなる Degrees of Freedom は一般に未知である. この問題に対し本研究では, LARS アルゴリズムの理論的特性を活用した Degrees of Freedom の推定手法を提案し, さらにそれによって Lasso, Elastic net, Adaptive lasso などの Degrees of Freedom の推定が可能になることを示した.