NISHIO Hirokazu[Translate]
状態のベクトル空間への埋め込み
任意次元のone-hotベクトルは2次元空間にパーセプトロンが識別可能な形で埋め込めることがわかった
離散的な状態はone-hotベクトルで表現できる
ということは、
状態は2次元ベクトルだと考えられる

昔関連することを考えていた: 状態のベクトル化
この時は直接的に構成しようと考えていた
なぜ状態ベクトル化したかったのか
状態遷移を学習で獲得・改善させたかった

これは与えられた状態遷移図から学習データを作って多層パーセプトロンで学習しようというアプローチ
既存の硬いコードで書かれた状態遷移図をニューラルネットに移し替えたい
これはif文の条件節を2クラス分類に置き換えるのと同じコンセプト

状態は通常リカレントする
このリカレントする部分を人間が観測可能にする必要がないなら、離散的な状態にする必要はない
ならば圧縮されたベクトルの状態で回して良い


連続状態に対する強化学習も関係しそう

"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]