Talk to the Cityを試すために日本語のサンプルデータが欲しいという声がある
https://gist.github.com/nishio/116708c1f65d21d224f2a5fe40bc962d
これを書き記しておくと今後自前のデータでTalk to the Cityをする人の助けになるだろう
元データは空行区切り
そこで空行で区切ってCSVにするコードを書いた
まずは最初の25件を入れてみてextraction stepだけ走らせてみる
$ python main.py configs/choice.json -o extractionJSON error: Expecting value: line 1 column 1 (char 0)
Input was: [https://gyazo.com/eb0af52aab8f22c0e91035bb2c106165]
Response was: 申し訳ありませんが、画像やリンクの内容を直接確認することはできません。画像の内容をテキストで説明していただければ、その情報をもとにお手伝いできるかもしれません。
Silently giving up on trying to generate valid list.
うまく行きそうならデータを増やしてみる
この時データを変えてるのにnothing changedと表示される(これはバグかも)
プロンプトを変更すれば再実行が必要だと認識する
強制的に再実行することもできる
$ python main.py configs/choice.json -fonly指定した場合も強制的に再実行する
$ python main.py configs/choice.json -o extraction$ python main.py configs/choice.jsonconfigでextractionのlimitを増やすの忘れがち
とりあえず100件で可視化してみる
configの"name", "question", "intro"を修正する
$ python main.py configs/choice.json -o aggregation$ python main.py configs/choice.json -o visualization最終的なconfigとprompt