2025-12-02
2025-10-09 チームみらい2025参院選「しゃべれるマニフェスト」オープンデータ
nishio チームみらい2025参院選「しゃべれるマニフェスト」オープンデータの解説を書きました。GitHubから抽出された2万件+の意見データとその高次元埋め込みベクトルがあり、しかもデータ元との対応づけもあるのでブロードリスニング的なものを実験する上で割と有用だと思います https://docs.google.com/document/d/1_oFEw-iNkbDQbYbhcOJFC61a5iMCTNUYUANBT8RxfhU/edit?tab=t.0
2025-09-28
2025-08-19
2025-08-06
2025-08-04
2025-07-31 Colin Megillとの議論
nishio For Japanese: 日本人のために日本語でも投稿しておきます。 これは単にissuesのタイトルだけを使ったのではなく、本文全体やdiffなどのデータを使っています。LLMは、1つの全体データから、貢献者が知覚する0〜Nの問題意識を抽出し、それらを高次元空間に埋め込みます。 AIがユーザにインタビューする段階で、本当はどのような問題意識を感じているのかを深掘りしてデータ化すべきだったと私は考えています。今回はインタビューの時点ではそれをやらなかったので、事後的に得られたissuesの本文から推測しています。チャットログから推測する手もあると思います。コストが数倍になるであろうことと、そういう使い方をユーザに許諾とっていないことが懸念点ですね。ちなみに今回の実験では30USD掛かっています。
ColinからPolis2.0に入れたら面白いのではと言われて、確かにそれは面白そうだからやっていこうと思う
2025-07-30 チームみらい問題意識の広聴AI
2025-07-27
nishio チームみらいの政策提案リポジトリが参院選の終了に伴ってpublic archiveになったので、最後のデータ収集をかけました。ここの/prs/に全PRのデータが入っているはずです。何か分析してみた人がいたらぜひ教えてください https://github.com/team-mirai-volunteer/pr-data/tree/main 各種分析ツールがここに入ってます https://github.com/team-mirai-volunteer/policy-pr-hub 大元のリポジトリはここにあるので、足りない属性データなどあればこちらから取得してみてください、policy-pr-hubのコードは参考になるかも https://github.com/team-mirai/policy
2025-07-26 policy repoがpublic archiveになった
2025-05-30 https://github.com/team-mirai-volunteer/policy-pr-hub/blob/main/README.md
現状