NISHIO Hirokazu[Translate]
政策プルリク活用プロジェクト

2025-10-09
>nishio チームみらい2025参院選「しゃべれるマニフェスト」オープンデータの解説を書きました。GitHubから抽出された2万件+の意見データとその高次元埋め込みベクトルがあり、しかもデータ元との対応づけもあるのでブロードリスニング的なものを実験する上で割と有用だと思います

2025-09-28

2025-08-19

2025-08-06

2025-08-04
20K件のデータをPolisに入れようとしたら大き過ぎてエラーになってしまった
1/10にサンプリングして入れた
PCAが1時間経っても終わらない
多分イテラティブな実装になっているから

2025-07-31
Colin Megillとの議論
>nishio For Japanese: 日本人のために日本語でも投稿しておきます。
> これは単にissuesのタイトルだけを使ったのではなく、本文全体やdiffなどのデータを使っています。LLMは、1つの全体データから、貢献者が知覚する0〜Nの問題意識を抽出し、それらを高次元空間に埋め込みます。
> AIがユーザにインタビューする段階で、本当はどのような問題意識を感じているのかを深掘りしてデータ化すべきだったと私は考えています。今回はインタビューの時点ではそれをやらなかったので、事後的に得られたissuesの本文から推測しています。チャットログから推測する手もあると思います。コストが数倍になるであろうことと、そういう使い方をユーザに許諾とっていないことが懸念点ですね。ちなみに今回の実験では30USD掛かっています。

ColinからPolis2.0に入れたら面白いのではと言われて、確かにそれは面白そうだからやっていこうと思う

2025-07-30

2025-07-27
>nishio チームみらいの政策提案リポジトリが参院選の終了に伴ってpublic archiveになったので、最後のデータ収集をかけました。ここの/prs/に全PRのデータが入っているはずです。何か分析してみた人がいたらぜひ教えてください
各種分析ツールがここに入ってます
大元のリポジトリはここにあるので、足りない属性データなどあればこちらから取得してみてください、policy-pr-hubのコードは参考になるかも


2025-07-26 policy repoがpublic archiveになった
=今後更新されなくなったのでデータ分析対象として扱いやすい


2025-05-30

現状
5/16に公開した「話せるマニフェスト」(いどばた政策)がうまく動いて1700件以上の修正提案が集まった
このデータを活用してより良い政策づくりにつなげたい
当初 https://github.com/team-mirai/random で試行錯誤していた、今もここのGithub Actionsで動いている
これを整理して他の人もいじれるようにしたいが現状できていない
整理したものをここにおきたい

"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]