NISHIO Hirokazu[日本語][English]

2024-09-08外部脳GitHub作業

2024-09-08

  • リポジトリは作った https://github.com/nishio/nishio-hirokazu-external-brain
  • 次に何をするべきか考える
    • あと3分で会議なので考えるだけ
    • 翻訳システムでJSONのExportなどは自動化されている
    • それを持ってきてバックアップのシステムをまず作る
    • たぶんこれ: https://github.com/nishio/etude-github-actions
      • image
      • DeepLの課金は更新されてたが何が問題で止まってるのか
      • This repository is over its data quota. Account responsible for LFS bandwidth should purchase more data packs to restore access.

      • あー、GitHub LFSか
    • 8/21のメール
      • Git LFS has been disabled on your personal account nishio because you’ve exceeded your data plan by at least 150%. Please purchase additional data packs to cover your bandwidth and storage usage:

      • https://github.com/account/billing/data/upgrade

      • Current usage as of 20 Aug 2024 10:38PM UTC:

      • Bandwidth: 8.21 GB / 100 GB (8%)

      • Storage: 150.09 GB / 100 GB (150%)

      • image
      • image
      • 3 data packにしても溢れてんじゃん
      • 4にした
      • image
      • image
      • うーん、まあ一旦これで。
        • 150GBのJSONがある?
    • etude-github-actionsは名前の通りGitHub Actionsの練習のために作った物で、予想以上にうまくいってしまったので長らく実運用されてきた

多分だけど、いろんな機能を一つのGitHub Actionsに詰め込みすぎてると思うんだ

  • 1: 最新のJSONへCosenseからのExport APIを叩かずにアクセスできる手段を作る
  • 2a: (1)から、翻訳、英語Scrapboxへのimport
  • 2b: (1)から、ベクトルDBにinsert いま(1+2a)と(1+2b)が並行で走ってる
  • (1)だけで完結させた方が他のいろいろなものと連携しやすい
    • 他のCosenseユーザにも「自分のCosenseのデータがアクセスしやすい形でGitHubにあってほしい」って人いるじゃろ

(1)にあんまり色々コードを書くべきでないと思うんだ

翻訳に関して

  • いまDeepLで行単位で翻訳している
  • GPTのコンテキスト長が長くなった2024-09-08現在としてはJSONリストで渡してJSONリストで返させるのでいいと思う

(C)NISHIO Hirokazu / Converted from Markdown (ja)
Source: [GitHub] / [Scrapbox]