数学的な多次元トゲトゲ
数学的には
N((0, ...), \sigma)のたくさんのデータとN((4\sigma, 0, ...), \sigma)の少数のデータがまざった分布(トゲ1つ分の表現)
4\sigmaは「十分離れた」の意味
面倒なのでこれを1と書くことにする(\sigmaをその分小さくすればいい)
K個のトゲは(1, 0, 0, 0, ...), (0, 1, 0, 0, ...), (0, 0, 1, 0, ...), ...という感じ
実験
SD=0.1
SD=0.2
SD=0.3
明瞭に分離している時にはSD=0.1のUMAPみたいに飛び地になる
混ざりすぎているとSD=0.3のように境目がわからなくなる
その境界においてトゲトゲになる