NISHIO Hirokazu[Translate]
Polisは意見のクラスタリング、TTTCはトピックのクラスタリング
2024-06-11

Talk to the Cityのクラスタリングをみた時点でそうなのではと思っていたが、具体的な事実で捕捉された
BERTopic、TF-IDFだし、実際の実装でもCountVectorizerを使ってる
つまりどういうことかというと「Xを禁止しろ」と「Xを妨げるな」は同じクラスタに入るということ。
前者はこの規定がクリエイターの福祉を損なう(からbadだ)と言ってる
後者はこの規定のただし書ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでないをメディアなどの権利者が拡大解釈して強く使うと、「AI 開発のための大規模な言語データ収集」を妨げる(からbadだ)と言ってる
つまり「AI 開発のための大規模な言語データ収集」はGoodだと言ってる
この二つは近い位置にplotされている
この種のgood/badの感情(センチメント)を分析する仕組みは入ってない


"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]