NISHIO Hirokazu
[Translate]
ひらがなとカタカナの埋め込み
ひらがなとカタカナの対応関係(ひらがな・カタカナ、行、段、濁音、半濁音、小文字、の6次元)を
t-SNE
で2次元に埋め込んだらこうなった。
不思議な曲がり方をしているのは、単にt-SNEのせいであって、
PCA
で線形に次元削減すると自明な感じの結果が得られる。
翌日2018-12-01、行と段を
回転エンコーディング
したことと、長音記号を足したことで10次元になった。
Tweet
Related Pages
PCA
ニューラルネットでローマ字を読む
→
t-sne
×
UMAP
×
PCA
×
mds
×
densmap
×
trimap
→
Stop Misusing t-SNE and UMAP for Visual Analytics
→
サイボウズラボ勉強会
×
世論地図勉強会
×
2024衆院選
×
世論地図
×
世論地図のumap
×
濃い塊の抽出
×
カール・ピアソン
×
karl_pearson
×
多次元尺度構成法
×
主座標分析
×
自己組織化マップ
×
som
×
self-organizing_maps
×
カーネル法
×
再生核ヒルベルト空間
×
サポートベクターマシン
×
isomap
×
isometric_mapping
×
lle
×
locally_linear_embedding
×
対立次元
×
PCA
×
UMAP
×
2022年参院選のumap可視化
×
polisクラスタ2つになる問題
×
東京大学谷口研究室・朝日新聞社共同調査
×
2022年参院選のpolis的可視化
×
convex_hull
×
code_for_japan_summit_2024
×
世論地図3970人umap
×
dbscan
×
高次元泥団子
×
集団極性化
×
匿名の市民の意見ベクトルはそんなに明瞭に別れてない
×
umapの結果をクラスタリングするべきか
×
tsneの結果のクラスタリングは慎重に
×
賛成反対データのumap
×
シン東京2050ブロードリスニング
×
テキスト埋め込みベクトルの分布
×
text-embedding-3-large
×
小さな粒のある一つの塊
×
クラスタリングとパーティショニング
×
k平均法
×
クラスタリング
×
spectralclusteringとhdbscanの違い
×
日テレnews×2024衆院選×ブロードリスニング
×
aiによるクラスタ解説
×
濃いクラスタ抽出
×
ptttc2024-11-12
×
外れ値
×
まずは大雑把に
×
全体像を把握したい
×
talk_to_the_city_turbo
×
tttc:_aiと著作権に関するパブリックコメント
×
talk_to_the_city勉強会
×
kj法
×
発想法
×
川喜田二郎
×
凝集型階層的クラスタリング
×
離れザル
×
側面
×
word2vecによる自然言語処理
×
概念の類似度は距離ではない
×
50枚のkj法は10時間の想定
×
5年間で129枚しかkj法をしていない
→
高次元データ分析勉強会
→
pol.is
×
意見分布の可視化
×
fisherの正確検定
×
polis:_scaling_deliberation_by_mapping_high_dimensional_opinion_spaces
×
polis勉強会
×
polis体験レポート:テロの原因究明をするか
×
polis体験レポート:同性婚を合法化すべきか
×
感情収集プラットフォーム
×
sentiment_gathering
×
sentiment_gathering_platform
×
理解されたいという欲求
×
西尾の体験_on_plurality_tokyo
×
PCA
×
UMAP
×
k-means
×
leiden_graph_based_community_detection
×
hierarchical_clustering
×
短文
×
polisをもっとやりたい
→
Polis
→
t-sne
×
laurens_van_der_maaten
×
UMAP
×
leland_mcinnes
×
ラベル数の動的変更
→
Nomic
→
2022年参院選のumap可視化
×
PCA
×
世論地図
×
東京大学谷口研究室・朝日新聞社共同調査
×
次元削減
×
talk_to_the_city
×
t-sne
×
bertopic:_neural_topic_modeling_with_a_class-based_tf-idf
×
bertopic
→
UMAP
→
PCA
×
UMAP
×
ヒモ状のアーティファクト
×
変分ベイズ
→
対立次元
→
PCA
→
Everything you did and didn't know about PCA
→
Polis
×
PCA
×
talk_to_the_city
×
UMAP
×
tttc的クラスタ説明生成
×
地図
×
データの多いpolisは半分こになりがち
×
イデオロギー・ベクトルの可視化
×
11万人の意見クラスター分析
→
Polis+TTTC的広域マップ
→
PCA
×
主成分分析
×
決定係数
×
説明分散
×
explained_variance
×
explained_variation
→
寄与率
→
plurality
×
Polis
×
サイボウズラボ勉強会
×
階層組織
×
llmがもたらす組織構造の変化
×
ダンバー数
×
国民ラジオ
×
松下幸之助
×
サイロ化
×
llm
×
audrey_tang
×
ブロードリスニング
×
人間の増強
×
知識社会は上司と部下の社会ではない
×
階層的な組織よりも水平的な組織の方が容易になる
×
統治構造
×
選挙は4年に一度5bit送信する遅い通信だ
×
vtaiwan
×
チームワークあふれる社会を創る
×
技術は中立
×
善用
×
悪用
×
パノプティコン
×
監視
×
社会信用システム
×
フェイクニュース
×
画像認識
×
雨傘運動
×
シンギュラリティ
×
broad_listening
×
decentralized_id
×
quadratic_funding
×
retroactive_funding
×
ソーシャルインパクトボンド
×
quadratic_voting
×
decentralized_identifiers
×
gitcoin_passport
×
worldcoin
×
web3はオワコン
×
終わったように見えるのは流行の上振れしか見えてないから
×
共感
×
異文化理解力
×
意思決定
×
合意形成
×
空気が支配する日本ではブロードリスニングが重要
×
human_augmentation
×
when_we_hear_“the_singularity_is_near”,_let_us_remember:_the_plurality_is_here
×
roulette_wheel_selection
×
t-sne
×
polis:_scaling_deliberation_by_mapping_high_dimensional_opinion_spaces
×
polis勉強会
×
都市国家
×
デジタルネイティブは4年に1度のアップロード帯域で十分とは思わない
×
紙と箱による民主主義
×
デジタル投票
×
アジェンダ設定の権限を人々に開放する
×
シルバー民主主義
×
一人一票
×
論点のブレインストーミング
→
PluralityとPolis勉強会
→
transformer
×
位置
×
数直線
×
循環
×
回転エンコーディング
→
Positional Encoding
→
UMAP
×
dimension_reduction
×
t-sne
→
Uniform Manifold Approximation and Projection
→
電子的kj法ツール
×
埋め込みベクトル
×
分散表現
×
PCA
×
欠損値
×
線形回帰
×
線形従属
×
回転
→
埋め込みベクトルの拡張
→
分散表現
×
PCA
×
次元削減
×
word2vec
×
回転無視は適切か?
×
自発的対称性の破れ
→
分散表現のマージ
→
自己組織化マップ
×
t-sne
×
位置付け
→
t-distributed stochastic neighbor embedding
→
主成分分析
×
特異値分解
×
共分散行列
×
PCA
×
固有値分解
×
主成分軸
×
特異値分類
×
svd
→
PCAを使わないでPCAを実装
"
Engineer's way of creating knowledge
" the English version of my book is now available on
[Engineer's way of creating knowledge]
(C)NISHIO Hirokazu / Converted from
[Scrapbox]
at
11/23/2025, 4:59:16 PM
[Edit]