Crowdsourced Adaptive Surveys

ひとことで CSAS（Crowdsourced Adaptive Surveys）＝参加者の自由記述をLLMで設問化し、マルチアーム・バンディットで“出す設問”をリアルタイム最適化する「自己進化型アンケート」。新しい論点やコミュニティ固有の関心を取りこぼしにくくします。

何が新しい？

仕組み（パイプライン）

自由記述を集める
LLMで設問化（1文要約など）
フィルタ：埋め込みで近傍検索→重複除外（閾値0.90）／毒性除去
参加者が評定：自分の設問＋既存からk件
選択最適化：Gaussian Thompson Sampling（GTS）で平均スコアが高い設問の提示確率を上げる（ただし確率フロア0.01で新規・少数も残す）
- どの質問を出すかをアダプティブにするって発想はPolisの質問提示順序の仕組みとも関連している
推定：提示確率の逆数でIPW補正して平均などを推定

実証から見えたこと（要旨）

Issue Salience（N=820, 2023/9/11–13）
- 生活費・医療・景気など生活直結の経済・医療系が最上位。Gallupの固定カテゴリより、参加者生成項目（例：プライバシー保護、候補者の透明性、メンタルヘルス）が上に来ることが多い。
Latino向けミスインフォ（N=319, 2023/7/6–7）
- 実際の出来事や党派ステレオタイプは“正確”寄りに、明白な虚偽は低評価。しかも参加者生成の主張が、既存ファクトチェック起点より**“信じられやすい”項目の発見に強い**。
ローカル政治
- ローカルでも全国級論点が紛れ込む一方、地域特有の懸念も自動で掘り起こせる。

強み

留意点・限界と対策

実装の最小レシピ（あなた向け）

まとめ CSAS＝「参加者が作る設問 × LLM整形 × バンディット最適化」。固定設問では見落としがちな論点を、短尺で、動的に、参加型で拾い上げる実践的フレームです。

(C)NISHIO Hirokazu / Converted from Markdown (ja)
Source: [GitHub] / [Scrapbox]