pEnglish2023-12-18
知識ネットワークの接続を保ったまま翻訳する翻訳システム
prev pEnglish2023-12-13
2023-12-18
何がやりたいのかをようやく言語化できた
from /villagepump/2023/12/18
- うーん、GPT3.5にリンクの接続性を保ったまま翻訳させるの、難しいぞ??
- 切れてることを検知して追加する方が楽な気がしてきた
- 一旦昼食にしてからblu3moの実装を読むか…
- コンビニに歩いてきて考えが進んだ
- 達成したいことは「リンクの接続を保った翻訳」
- Scrapboxの内部リンクがすごく有益なものだと思っているが、単純な翻訳では切れてしまう
- 接続を「確実に」保ちたいなら、それはLLMではなくプログラムで担保すべきでは?
- リンクのつながりを担保するコードを書いた
- 切れてるリンクを加筆するスタイル
- しかしScrapboxがエクスポートされたJSONだけでは赤リンクかどうかわからないことが原因で赤リンクだろうがなんだろうが強制的に加筆してつなぐ
- それはそれでどうなんだ?
できたと思うんだけど検証のためにいきなり全体で走らせるのはエラーだらけになるだろうし、とはいえ「リンクがつながってるかどうか」は全体の変換が終わった後にわかる属性だしネクストアクションどうしようかな
食器を洗いながら考えたけど、まずscaffoldのネットワークを出力してそれに肉をつけていく路線が良さそう
それはそうと翻訳レビューをしてみる
各リンクの出現回数でソートして上位を眺める
初っ端から難しいやつがきた
「渾沌をして語らしめる」はAllowか?
- Enableか?Letか?
- みたいなことを考察していくと一行ごとに新しいページができかねないなw
簡単なものはある
- 単なる事実、立川さんは「たてかわ」
- これは修正した
- 「立川」で検索して何箇所もあるのを直した
- 立川談志もいたので一括で修正というわけにはいかない
- 未踏はMITOU、未踏社団はMITOU Foundation
- これも検索して全部直すか
- Unexplored / Undiscoveredと訳されてることが多い
- 未踏性は...
- MITOU-SEIにしておこう
- MITOU-nessなのかもしれない
- 歩かない人に未踏地は見えない
- この「未踏地」は?
- これは
unexplored landだろうな
- 「未踏」という言葉を「絡めてる」的感覚
- ハッシュタグ事故:
#未踏会議」
進む方向に他人の足跡があるならそれは[未踏の道]ではない
「ブルー」は何?
- あっ、レゴの発注シート内で大量にヒットしてるw
- 出現回数をカウントするのではなく出現ページ数をカウントすべきだな
next pEnglish2023-12-19