NISHIO Hirokazu[日本語][English]

数学的な多次元トゲトゲ

概念的に「高次元空間におけるトゲトゲ」と呼んでいた構造

  • 11万人のUMAPのこのあたりがそれでは
    • image
  • これはつまり世論地図3970人UMAPのこれでは
    • image
  • 数学的には
    • $N((0, ...), \sigma)$のたくさんのデータと$N((4\sigma, 0, ...), \sigma)$の少数のデータがまざった分布(トゲ1つ分の表現)
    • $4\sigma$は「十分離れた」の意味
    • 面倒なのでこれを1と書くことにする($\sigma$をその分小さくすればいい)
    • K個のトゲは(1, 0, 0, 0, ...), (0, 1, 0, 0, ...), (0, 0, 1, 0, ...), ...という感じ

実験 SD=0.1

  • image SD=0.2
  • image SD=0.3
  • image

明瞭に分離している時にはSD=0.1のUMAPみたいに飛び地になる 混ざりすぎているとSD=0.3のように境目がわからなくなる その境界においてトゲトゲになる image


(C)NISHIO Hirokazu / Converted from Markdown (ja)
Source: [GitHub] / [Scrapbox]