NISHIO Hirokazu[日本語][English]

Talk to the City勉強会

2024-06-14 サイボウズラボ勉強会講義資料 西尾泰和

  • 口頭の質疑を加筆したいが、忙しくて遅れてる

今までの振り替えり

時事の話

  • 2024-06-06 安野たかひろ氏が東京都知事選に出馬へ
    • これまでの選挙期間は「候補者の意見をブロードキャストする」、つまり候補者の考えていることを一方的に有権者に伝える時間でした。私は今回、テクノロジーを使うことで人々の意見を聞く期間にできると考えています。これをデジタル民主主義の世界では「ブロードリスニング」と呼びます。このブロードリスニングを通じて、選挙期間をみんなで理想の政策を考えるための時間にしたいと思います。

    • マイナンバーカードを使った本人確認で一人一票の投票を実現して
      • 直接投票の結果を元に民意を解像度高く捉える

    • そして
    • Audrey Tangからもコメントをもらっている
      • ”安野さんのブロードリスニング、マイナンバーシステム、オープンソース精神を組み合わせたやり方を私は気に入っています”

      • ”安野さんは抗議活動をしているのではない。私はそこがすごく好きだ。彼は『私たちは良い方向に変われる』と言っているのだ”

  • 感想
    • golden_lucky Plurality、日本でこんなにすぐ現実味を帯びた選択肢になるとは思ってなかった

    • nishio ほんとそれ()

    • ブロードリスニングの概念を知ったとき、これは生身の人間に不可能なレベルの「多勢の意見を聞くこと」を可能にする技術だと思った。
    • なので、人間増強知的生産性の向上の一種だと思っていた。
    • 今後のLLMの発展で実現コストが下がっていって、数年で「手軽に使える技術」になり、5年10年後にはサイボウズのようなグループウェア企業にとって無視できない技術になるだろう
    • 〜ぐらいのタイムスパンで考えてたのて、1年でここまで来るとは、世界の変化の加速が激しい!という感じ
  • 都知事選でTalk to the Cityをする
    • takahiroanno #TOKYOAI つきの公開ツイートはAPI経由でクロールした上で、LLM、Talk to the cityなどを使って可視化を試みる予定です。

    • 手伝ってます!

ブロードリスニングのおさらい

  • image
  • 解説
    • 情報を複製し配信する技術の発展により、一人の人が大勢の人に考えを伝えることが容易になった。
    • しかし大勢が情報発信すると、一人が受け取る情報量が膨大になり情報洪水で溺れてしまう。
    • 人々が積極的に発信する社会や会社では、大勢の意見を聞くことを支援する技術が重要になる。
  • 技術的な話
    • これは広い意味では「要約」の一種
    • だがLLMの学習において「要約タスク」は、論文の本文を入れてアブストラクト部分を出すなどの学習データで訓練されている
    • これは「一人の人が書いた整った文章」を入力として想定している
    • 「大勢の人がそれぞれ書いた文章集合」の要約技術が必要になる
    • それをどうやるかの試行錯誤が行われつつある
  • 余談
  • 2024-05-31の2024年度 人工知能学会全国大会 オーガナイズドセッション "AIとデモクラシー"の基調講演でCode for Japanの関 治之さんが「シビックテックによる、社会と民主主義のアップデート」という発表をしたんだけど
    • image
    • image
    • 綺麗なスライドに突如出てくる僕の手書きの図www いいのか?ww
    • (誰か綺麗にしたバージョンをCC0とかで作ってくれないかなw)
    • (なお関さんにはScrapboxにある画像を好きに使っていいよと許諾してある)

Polisのおさらい

  • image
  • 文章に対する「賛成(+1)」「反対(-1)」「わからない/中立(0)」が意見ベクトルとなる
  • このベクトルがクラスタリングされ、クラスタを分ける要因になった文章などが表示される
  • 実際にやってみたもの
    • Polis体験レポート:同性婚を合法化すべきか
    • image
    • 合法化に対する賛成(73%)よりも賛成割合の高い文章が見つかった
    • 例: 社会的証明としての婚姻と、税制・社会保障としての婚姻は別のレイヤーでそれぞれ検討されるべき課題がある。: 賛成74%、反対11%、中立13%
    • 同性婚反対の人の多いクラスタAで86%、賛成ばかりのクラスタBで69%が賛成している、どちらも過半数
    • つまり、この「同性婚賛成反対」という対立を解消するためには、まず双方が合意している「社会的証明と、財政社会保障とを分離しましょう」路線を進めて行くのが良さそう、とわかる
    • ちなみに台湾の同性婚は親族にならない
      • 同性婚の反対者が、同性婚自体に反対してるのではなく、たとえば「息子が男性と結婚して息子が幸せになるなら、それは認めて良い」「だけど、その『息子の配偶者男性』はよくわからんので家族の一員にするのには抵抗あるなー」という気持ちの人が多いのだということが明らかになった
  • 可視化と分析によって、対立構図を別の切り口から観察できるようになる
  • Polisは2015年にはvTaiwanで使われてる
  • 2015年のものなのでLLMなどのAI的な機能はない

Talk to the Cityとは

  • Audrey Tang(要約): 2014年には、多くの人々の意見を集めて、全ての微妙なニュアンスを保持することは不可能でしたが、現在では「Talk to the City」というツールのおかげで、それが非常に簡単かつ安価にできるようになりました。

  • Talk to the Cityは、AI Objectives Institute (AOI)が開発したオープンソースの分析ツール
    • ツールの目的: 集団的議論/集団的意思決定 の改善
      • 特に都市などコミュニティとの対話を促進するために設計された
    • TwitterのツイートやPolisの結果などを収集し、それを分析する
    • 意見や議論のクラスターを可視化し、クラスターごとの解説を生成する
    • これによって人々がコメント分布の全体像を把握することを助け、建設的な対話を促進する
  • AI Objectives Instituteとは
    • ピーター・エッカーズリー(Peter Eckersley)が2021年に設立した非営利組織、AIの発展方向を人類の繁栄に導くことを目的としている
    • Peter Eckersleyは、オーストラリア出身のコンピュータ科学者で、コンピュータセキュリティ研究者、Electronic Frontier Foundation(EFF)で働き、「Let's Encrypt」「Certbot」「Privacy Badger」などのプロジェクトを立ち上げた
      • Let's Encryptはウェブ全体の安全性とプライバシーを向上させることを目指している知名度の高いプロジェクト
      • サイボウズもこのプロジェクトに6年間寄付してきた: Open Source Software | Cybozu Tech
    • Peter Eckersleyは残念ながら2022年に亡くなっている、同僚のDeger TuranBrittney Gallagherが中心となってAOIの活動を引き継いでいる。

Talk to the Cityの技術的仕組み

  • Polisと違って入力はテキストデータ
    • なのでテキストデータがあるなら何にでも使える
    • Polisに限らず、Twitter、Google Form、ニュース記事のコメント欄、グループウェアなど、多様なデータソースを活用できる
    • 突飛な実験として書籍の各段落を入れてみた:
  • 入力テキストに対してLLMを使って簡潔で読みやすいメッセージを抽出する
    • JSONリスト形式で取得するので、1つの入力に対して複数のメッセージが抽出されることもある
    • デフォルトだとGPT-3.5-turboにFew-shotsで例示している
  • このメッセージの集合をBERTopicでクラスタリングする
  • UMAPで2次元空間に落として視覚化
  • クラスタをドキュメントとみなしたTF-IDFで、そのクラスタを特徴づけるキーワードを特定する
  • LLMがクラスタの解説を生成する

実際に見てみよう

  • 2024-06-12 第一弾が公開された!
    • takahiroanno 出馬表明に対するコメントを抽出し、AIで分析レポートを作成しました。

    • 私に対する関心やご懸念がどこにあるのか、より具体的なイメージが湧いてきました。データやAIも活用しながら、都民のみなさまのお考えや想いに向き合ってまいります!

    • takahiroanno テクノロジーを使うことで人々の意見を聞くことを、デジタル民主主義の世界では「ブロードリスニング」と呼びます。その具体例として、まずはこちらの分析レポートを作成しました。今後さらにアップデートし、みなさまの意見に耳を傾けていきます!

  • image

Polis 2.0

  • Audrey Tangが提唱したアイデア
    • 公式な発表などはされてない開発コードネームみたいなもの
    • (台湾デジタル発展省MODAのmashbeanに確認した)
  • PolisのデータからTTTCでクラスタを作る
  • そのクラスタから生成された仮想的意見リーダーとチャットをできるようにする
  • image
  • これがAudreyがPlurality Seoulで話してたもの
    • image
    • 多くの参加者にとって、熟議という文脈でAIと対話するのは初めてのことです。

    • つまり、一人でAIと話すのではなく、みんなの利益のためにグループで議論するのです。

    • このような増強された熟議によって、誰もがデジタル民主主義に貢献できる、そしてデジタル民主主義の恩恵を受けることができるのです。

    • 増強された熟議は、社会のレジリエンス(困難を乗り越える力)を高めます。

    • 異文化に対する理解と共感を深め、情報が整合性をもって統合されるからです。

    • この熟議基盤はオープンソースのツールとして作られています。

  • この「増強された熟議」は僕の関心事である知的生産性の向上の観点からもとても面白い
    • が、あんまり盛り上がってない
    • その理由はおそらく
      • 話し相手がキャラクター性のない「クラスター」という状況に人が慣れていない
      • こういう形のコミュニケーションに不慣れなので、まずは他人がやってるところを見たい
      • 他人のやり取りを見れるようにしてもある程度の人数が集まらないと他人に出会えない
  • その観点から安野さんの施策を見ると面白い
  • 都知事選の候補という観点では
    • 生身の人間は1日24時間の一部の時間しか使えない
      • 駅前に立ったりすることで、そこに物理的に来ることができた有権者とコミュニケーションする
      • コミュニケーションの内容は雲散霧消する
    • デジタルの人間(仮想的人格)は24時間活動し続けられる
      • YouTubeの特定のチャンネルにずっといて、世界中どこからでもアクセスしてコミュニケーションできる
      • コミュニケーションの内容は保存される。
        • つまりYouTube Liveに寄せられたコメントをTTTCの分析対象にできる
  • うまいこと考えたなーと思っている

双方向的マスコミュニケーション

  • 1対1のコミュニケーションでは「一方的に喋るのではなく相手の話を聞きましょう」「口は一つ、耳は二つなのだから2倍聞くつもりでいましょう」みたいなことを言う

  • しかし従来のテレビや新聞ではなどでのマスコミュニケーションでは、一方的に発信されたものを、たくさんの視聴者が受信するだけであった

  • なぜそうなったのかというと、情報を複製して大勢に届ける技術の方が、情報を要約する技術よりも早く発展したから

  • image

  • いろいろな技術がいろいろな速度で普及したので一概には言いにくいがドイツの国民ラジオが1939年に70%の国民に普及したのが一つの例

  • この100年の間に、一方向的マスコミュニケーションに慣らされた視聴者は「自分が話してもいいんだ」「聞いてくれる人がいるんだ」という自信を持ちにくくなってしまった

  • まず「聞く姿勢」を打ち出してコメントを集め、それを可視化して「みなさんの声を聞いた結果、こうなった」と示し、それを見た人々の認識がアップデートされて、よりよいコメントを書いて……というサイクルを回していくことによって、より良い「双方向的マスコミュニケーション」が実現していく

  • image

  • 転がりながらだんだん大きくなっていく雪玉のイメージ

まとめ

  • この勉強会では、ブロードリスニングPolisTalk to the CityPolis 2.0について解説し、マスコミュニケーションの双方向化という未来の方向性について説明した
  • デジタル民主主義を掲げる安野たかひろ氏の東京都知事選キャンペーンは、ブロードリスニングの概念を活用し、多くの有権者の声に耳を傾けることを目指している。
    • YouTubeを活用した双方向のコミュニケーション戦略は、従来の一方的なマスコミュニケーションを変革する可能性を秘めている。
    • このキャンペーンは日本におけるブロードリスニングの知名度を高め、それを重要だと考える有権者が多いことが示されれば、他の政治家もブロードリスニングを取り入れていくだろう。
  • PolisとTalk to the Cityはどちらもコピーレフトなオープンソース(AGPL)のツールであり、利用者が増えるほど洗練されていく。
    • 技術の発展によって、大勢の意見を効率的に集約し、建設的な対話を促進することが可能になる。
    • こうした取り組みを通じて、より多くの人々が民主主義のプロセスに参加し、社会の意思決定に貢献できるようになるだろう。
  • マスコミュニケーションの双方向化は、フィードバックループを繰り返すことで徐々に実現に近づいていく。
    • 雪玉が転がりながら大きくなるように、こうした取り組みが積み重なることで、より良い社会の実現につながることを期待したい。

余談: 余裕があったら書く

  • KJ法とのアナロジー
  • image
  • 発想法 p.77
  • 自分の心のなかに、「これだけの紙きれの資料は、自分の考えによれば、内容的に市場調査・品質管理・労務管理と三つに大きく仕切るのが正しい」などというたぐいの、グループ分けについての独断的な原理をあらかじめ頭の中にもっているからである。その独断的な分類のワクぐみを適用し、そのできあいのワクの中にたんに紙きれの資料をふるい分けて、はめこんでいるにすぎないのである。これでは KJ法の発想的意義はまったく死んでしま う。

  • 川喜田二郎は人間が独断的な分類のワクぐみへのふるい分け、はめこみをすることを批判した
  • その対処法として1枚1枚をみて関連するものとくっつけるKJ法を提案した
  • これはデータサイエンスの言葉で言うなら凝集型階層的クラスタリング
  • TTTCでは、人間ではなく機械がクラスタリングを実行することで「人間が独断的な分類へのはめこみをしてしまうこと」が避けられている
  • KJ法の効用の一部を手軽に得られる方法だと思う
  • KJ法を丸ごと置き換えるか?
    • そうではないという肌感
    • 目下のところ「近さ」は「埋め込みベクトル空間のコサイン距離」になっている
    • ここが人間のKJ法との違いなのではないかと思っているが、実は違っていなくて人間も同様の処理をしているかもしれない
    • 同一のデータに対して人間がKJ法をやったのとTTTCをやったのを比較するともっと言語化されると思う、今後の研究
  • U理論とのアナロジー
    • image
      • 1: 枠の中にこもっている
      • 2: 枠の外を見る
      • 3: 外からの視点によって元々持っていた枠が薄れていく
      • 4: 外からの視点が集まることによって「いくつもの視点から見た理解」が生まれる
    • TTTCは人々をレベル3~4へ移行させることを促すシステムと言えそう

(C)NISHIO Hirokazu / Converted from Markdown (ja)
Source: [GitHub] / [Scrapbox]