NISHIO Hirokazu[Translate]
潜在意味解析
潜在意味解析: Latent Semantic Analysis, LSA
潜在的意味索引または潜在意味インデックス: Latent Semantic Indexing, LSI

各行が各単語、各列が各文書の疎行列
各成分の重み付けに tf-idf を使う
この行列を特異値分解する
k個の最大特異値を選べばk次元への最小誤差での埋め込みができる
文書IDから単語tf-idfベクトルを得る関数を、隠れ層がk個・1層のAutoencoder的ネットワークで学習するのに相当する

"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]