NISHIO Hirokazu[Translate]
ベクトル埋め込みを使った大きすぎるリンクの分割

ベクトルに埋め込みます
k平均法で2〜5個にクラスタリングします
シルエット係数が最適となるKを選ぶ

悪くないのでは?

追加で「それぞれのグループ」をなんと呼ぶべきかのヒントも与えたい
ページ自体の他に、ページタイトルもベクトル埋め込みする
中で使われてるリンクの文字列もやってもいいかも
そして各クラスタの代表点に最も近いものを「クラスタを代表する文字列」とする
Top10くらい出してもいいかも



"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]