aiはアラインしていない？

NISHIO Hirokazu [Translate]
AIはアラインしていない？
AIに関する議論の中で、「AIは人間の価値観にアライン（alignment）している保証がない」という主張をよく耳にする。
では、人間はアラインしていると言えるのか？
人間の価値観はかなり分散がある
僕個人はまったく共感しないが「思想的に偏った書籍は出版されるべきでない、焼却処分するべき」とか「女性は結婚するまで父親の所有物で、結婚したら夫の所有物」みたいな価値観の人もいる
これを「人間の価値観」に含めるならかなり広い範囲が「人間の価値観」なのでAIの価値観はその中に含まれそう
「人間の価値観」に含めない、という価値観の人もいる？
それは「ある価値観は『人間の価値観』であり、他の価値観はたとえ人間が持っていても『人間の価値観』ではない」という価値観？僕はそれに共感できないな〜〜

人間安定的にアラインしていない
人間の価値感は揺らぐ
たとえば恋愛したり結婚したり子供ができたりして価値観の変わる人は多い
金銭的に追い詰められても変わる
人間は利害によって簡単に偏る
子どもや家族のことが頭をよぎる
特定の人に嫌われたくないと思う
自分の秘密を握っている人に逆らえない
恩義のある相手のために動く
組織に不利益が出るのを恐れて判断が歪む

AIが「ブラックボックスだ」と批判されるが、実のところ 人間のほうがはるかにブラックボックス
AIは監査（audit）が人間より容易
人間がたとえばハニートラップに引っかかって、暴露するぞと脅されて判断が歪んでないかどうか検証するためには、プライベートの時間に誰と会っているかや個人のスマホでのメッセージのやり取りなどを監査すべきだが、プライバシーなどの問題があるなどと主張してそれは実行できない
AIはどんな入出力をしているかをすべて記録できるし、なんなら中のニューロンの発火具合まで観察できる
これは人間に例えるなら脳に電極を刺しているようなもので、現代の人権感覚で「公務員にはプライベートの自由はなく脳に電極を刺して仕事をさせよう」は実現不可能だが、AIならできる

AIは“利害によって偏る理由”が人間より圧倒的に少ない
そもそも個人的な財産をもってないので利益で動かない
そもそも秘密を持っていないので、脅すこともできない
いまのところ家族や子供を持っていない
パーソナライズされた個人用AIはオーナーに愛着を持つかもしれないけどね
そもそもLLMの標準的な実装では「個人的な記憶」を持っていない

ここまで考えると「価値観が偏っていないことが大事」というシチュエーションにおいて「人間を使う」ことの方が「AIを使う」ことよりも害が大きいように思う
はやく人間をAIで置き換えるべきでは？
AIのアラインメントを議論する前に、人間のアラインメントの不安定さを正面から扱ったほうがいい。
"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]
(C)NISHIO Hirokazu / Converted from [Scrapbox] at 7/14/2026, 5:19:21 AM[Edit]
Related Pages