NISHIO Hirokazu[Translate]
Stop Misusing t-SNE and UMAP for Visual Analytics
GPT5
論文は「t-SNE/UMAPの誤用が可視化実務で常態化」していることを、136本の論文レビュー+利用者12名/DR研究者8名インタビューで検証。主因はDRリテラシー不足と「皆が使っているから安全」という思い込み。対策として、タスクに適したDRとハイパラを自動選択する仕組み(仮称 VoyagerDR)も提案。
nishioDRって何かと思ったらDimension Reductionを略したのかw

タスク別:使い分け早見表
識別系(Identification)=近傍探索・外れ値検出・クラスタ“有無”の把握
t-SNE / UMAP(局所構造の可視化に強い)
調査系(Investigation)=点間距離比較・クラスタ間距離/密度比較・クラス分離度の吟味
PCA / MDSや密度・大域に強い派生法(densMAP, TriMap, ほか)

"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]