数学的な多次元トゲトゲ
概念的に「高次元空間におけるトゲトゲ」と呼んでいた構造
- 11万人のUMAPのこのあたりがそれでは
- これはつまり世論地図3970人UMAPのこれでは
- 数学的には
- $N((0, ...), \sigma)$のたくさんのデータと$N((4\sigma, 0, ...), \sigma)$の少数のデータがまざった分布(トゲ1つ分の表現)
- $4\sigma$は「十分離れた」の意味
- 面倒なのでこれを1と書くことにする($\sigma$をその分小さくすればいい)
- K個のトゲは(1, 0, 0, 0, ...), (0, 1, 0, 0, ...), (0, 0, 1, 0, ...), ...という感じ
実験
SD=0.1
明瞭に分離している時にはSD=0.1のUMAPみたいに飛び地になる
混ざりすぎているとSD=0.3のように境目がわからなくなる
その境界においてトゲトゲになる
