Lessons from the French Government's Grand Débat
Lessons from the French Government's Grand Débat: an AOI talk with
Deger Turan - YouTube

プレゼンテーションの内容を要約します。
Intro:
プレゼンターはDegerで、Cerebraの創業者兼CEO。大規模な機械学習を活用し、主に小売企業向けに市場シグナルに対する事業調整の方法を提示している。
過去には政治・経済分野でも同様のアイデアを実験的に適用。本トークではその経験から学べることを考察する。
Deger's background:
スタンフォード大学でAndrew VengaやDan Girovskyと協力し、市民からのフィードバックを分析・理解するシステムを連邦政府機関向けに開発。
自然言語処理とイベント検出技術を活用し、市民の意見を把握・可視化することで、政府と市民の双方向のアカウンタビリティ向上を目指した。
Large-scale feedback collection:
国王
ルイ16世の発案で、市民が意見を表明できるノートを教会に設置。しかし、最も多かった意見は鳩小屋の撤去を求めるものだった。
市民が本当に何を求めているのかを把握するには、適切なチャネルを確立し、継続的にフィードバックを収集する必要がある。
Three main pillars:
データの透明性を確保し、参加者全員が自分の意見や
他者との比較を可視化できるようにする
中央機関と市民が相互にアカウンタビリティを持てる仕組みを確立する
ランダムサンプリングで声が埋もれがちな
少数意見も確実に可視化・考慮する
Technical structure:
外部・内部のテキストソースと、選択式/行動フィードバックを統合するマルチモーダルなシステム
特定の質問に対するコアテーマを同定するためのドメイン固有のオントロジーを作成
テキストと行動の両面からのイベントをベクトル化し、イベント間の関連性を比較
これにより、どのイベントが会話の盛衰を引き起こしたかを特定し、会話の進展を予測
Demo:
200万件の自由回答による500万件のテキストデータを分析し、カテゴリごとの意見分布を可視化
一時的なデータ収集に留まらず、継続的な対話プラットフォームに発展させることが理想的だったと指摘
What did the French Government do:
フランス政府は結局、一時的なフィードバック収集で満足し、上位の意見をまとめて発表するに留まった
What did you do:
他の分野での適用可能性を探るため、Regerは小売業界に着目
小売企業は顧客ニーズを無視できないため、データ活用への動機づけが強い
レビューデータと行動データを統合分析し、在庫補充や販促施策の最適化につなげるソリューションを開発
Where can we go from here:
5つの方向性として、1.規制当局へのフィードバック、2.認知的不協和の可視化、3.市民の株主としての権利行使、4.集合的意思決定システム、5.金融システムへの直接連携、などが考えられる
Abstractive clustering:
抽象的なクラスタリングについて、頻出フレーズの統計的検出とトピックモデリングによるクラスタリングを行っている
提出された意見を、文章レベルで抽象化してクラスタリングすることは技術的に可能
Clustering:
クラスタリングは反復プロセスと捉えられる。クラスタリングでラベルを得て、そのラベルで分類学習を行い、分類できなかった事例にも着目する
定型文やボットによる投稿は類似性が高いためクラスタリングの初期段階で検出可能
最終的にはデータ活用の目的次第で、クラスタリングの戦略を適宜調整する
Sample Bias:
デジタルでのフィードバック収集は参加者にバイアスがかかりやすい問題がある
バイアス自体も重要な情報と捉え、他の信号も組み合わせて体系的に考慮することが重要
フィードバック収集をいかに一般に浸透させるかによって、バイアス低減の余地はある
Transformer path:
Transformerモデルの分類精度は90%台に達しているが、100%ではない
分類器の性能を逐次評価し、誤差の範囲を示しながら使うことが肝要
Where can we go from here:
具体的なユースケースとして、住宅ローンや所有権の問題に着目している
銀行と借り手の双方にとってwin-winとなる融資判断をデータから下せないか
小売業の知見を参考に、サービス提供者と利用者のニーズをデータでマッチングさせるアプローチを模索したい
以上が、プレゼンテーションの主要な論点の要約です。大規模な市民フィードバックの収集・分析技術の進展と、それを社会の様々な場面で活用する可能性について議論されていました。技術的な課題よりも、いかに実社会の問題解決に役立てるかが問われていると言えます。