NISHIO Hirokazu[Translate]
word2vecとKJ法
word2vecとKJ法
>word2vecKJ法の支援に使えるのではないかとずっと思っていたけども、「そもそもKJ法自体が付箋に書かれた短文に『空間上の位置』というベクトルを対応付ける方法じゃないか」と今気づいた。
>関係の有りそうなものが近くに来るように配置します」までが短文をベクトルに対応づけるフェーズで、そこからグループを作って表札をつけるのは現状のword2vecに欠けている何か。
>word2vecで作ったベクトルの適当に1点を選んでそれに近いものベスト50とかを画面に出したらどうか。
>仲間なものとそうでないものをいくつか選ぶと、それらが一番分離されるような方向に回転されると良いのではないか

word2vecは単語の意味をベクトルに対応付ける
単語の「意味」をシンボル=離散集合の元から、ベクトル=連続集合の元に変えた
自然言語処理において、書かれた単語は同一視されて離散集合の元となっている
しかしこれは技術発展の一時期において情報通信技術が貧弱であったために圧縮せざるを得なかった、と解釈できる
1ピクセル16万色の写真が使える今の時代から振り返って、16色しか使えなかった時代が「一時的な技術的制約」に見えるのと同様
語彙数100万=1単語当たり20bit
これに対して32bit×100次元などの値で単語の意味(記号内容シニフィエ)を表現する

"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]