NISHIO Hirokazu[日本語][English]

政策プルリク活用プロジェクト

2025-12-02

  • チームみらいに使える余暇の時間がインタビューAIグランプリに吸い取られたのでしばらくおやすみ
  • 開発した新しいビューを広聴AIにフィードバックかとかを考えないとな
    • 広聴AIにビューを追加することをそもそも想定して設計してないのでそこを改善する必要がある
    • 来年6月マイルストーンで良い気がする

2025-10-09 チームみらい2025参院選「しゃべれるマニフェスト」オープンデータ

nishio チームみらい2025参院選「しゃべれるマニフェスト」オープンデータの解説を書きました。GitHubから抽出された2万件+の意見データとその高次元埋め込みベクトルがあり、しかもデータ元との対応づけもあるのでブロードリスニング的なものを実験する上で割と有用だと思います https://docs.google.com/document/d/1_oFEw-iNkbDQbYbhcOJFC61a5iMCTNUYUANBT8RxfhU/edit?tab=t.0

2025-09-28

2025-08-19

2025-08-06

2025-08-04

  • 20K件のデータをPolisに入れようとしたら大き過ぎてエラーになってしまった
  • 1/10にサンプリングして入れた
  • PCAが1時間経っても終わらない
    • 多分イテラティブな実装になっているから
  • 星さんのPRでの議論のPolis

2025-07-31 Colin Megillとの議論

nishio For Japanese: 日本人のために日本語でも投稿しておきます。 これは単にissuesのタイトルだけを使ったのではなく、本文全体やdiffなどのデータを使っています。LLMは、1つの全体データから、貢献者が知覚する0〜Nの問題意識を抽出し、それらを高次元空間に埋め込みます。 AIがユーザにインタビューする段階で、本当はどのような問題意識を感じているのかを深掘りしてデータ化すべきだったと私は考えています。今回はインタビューの時点ではそれをやらなかったので、事後的に得られたissuesの本文から推測しています。チャットログから推測する手もあると思います。コストが数倍になるであろうことと、そういう使い方をユーザに許諾とっていないことが懸念点ですね。ちなみに今回の実験では30USD掛かっています。

ColinからPolis2.0に入れたら面白いのではと言われて、確かにそれは面白そうだからやっていこうと思う

2025-07-30 チームみらい問題意識の広聴AI

2025-07-27

nishio チームみらいの政策提案リポジトリが参院選の終了に伴ってpublic archiveになったので、最後のデータ収集をかけました。ここの/prs/に全PRのデータが入っているはずです。何か分析してみた人がいたらぜひ教えてください https://github.com/team-mirai-volunteer/pr-data/tree/main 各種分析ツールがここに入ってます https://github.com/team-mirai-volunteer/policy-pr-hub 大元のリポジトリはここにあるので、足りない属性データなどあればこちらから取得してみてください、policy-pr-hubのコードは参考になるかも https://github.com/team-mirai/policy

2025-07-26 policy repoがpublic archiveになった

  • =今後更新されなくなったのでデータ分析対象として扱いやすい

2025-05-30 https://github.com/team-mirai-volunteer/policy-pr-hub/blob/main/README.md

現状


(C)NISHIO Hirokazu / Converted from Markdown (ja)
Source: [GitHub] / [Scrapbox]