バンディット問題の理論とアルゴリズム p.38 トンプソン抽出
https://hagino3000.blogspot.com/2015/07/thompson-sampling.html https://hagino3000.blogspot.com/2016/12/linear-bandit.html
#強化学習