2023-03-25 pScrapboxAutoTrans
翻訳したものをこのScrapboxに入れるのかどうか
Scrapboxに気軽に書いたのを自動的に機械翻訳して英語版のScrapboxプロジェクトに転記した上で英語アカウントでツイートし、リアクションがあった時に僕に通知が来るようにして社会的トリガーを仕掛けるというのはどうか
ScrapboxのAPIでは逐次的アップデートを実現するの面倒そう
スモールスタートとして、まずJSONでエクスポートして翻訳してインポートしたらいい
先頭行に
(auto-translated from [Japanese http://....])と挿入する?
ScrapboxAutoTrans開発日記2021-12-28
将来的にはGithub Actionで静的ファイルとして吐いてGithub Pagesとかでホストすると良いのではないか
2023-03-26 寝て起きる
問題が複雑
Github Actionで取得するところまではできている
翻訳したデータもおけばいい?
翻訳するまでもなくすでに英語なものがある?
見積もり
from エンジニアの知的生産術英語化プロジェクト
全部エクスポートして見積もって見たら24M文字あるので全部翻訳すると6万円掛かることがわかった
from 機械翻訳の費用
¥2,500 per 1 million characters
characterがUnicode characterかbytesか
bytesなら27,493,421
見積もり7万円弱
実行
全体実行中
メモ
ビューのことは何も考えていない
2023-03-30
割とエラーでこけてて、リトライ付けてなかったのでまだ終わってない
https://github.com/meganii/sandbox-github-actions-scheduler
https://github.com/nishio/etude-github-actions
@TwitterDev: Today we are launching our new Twitter API access tiers! We’re excited to share more details about our self-serve access. 🧵
langdetectはやめた方が良さそう
#天邪鬼 #悪魔の代弁者って英語だと思う」って言って1行訳し漏らしたりしているhttps://www.deepl.com/account/usage
2023/4/1
まず0を1にして、それから改善する
python main.py 2578.84s user 270.36s system 98% cpu 48:27.16 totalpython main.py 3.73s user 2.56s system 68% cpu 9.118 totalこの一週間の間の更新を再クロール
python main.py 39.36s user 14.77s system 10% cpu 8:49.13 total
再翻訳total 28492485 no_cache 156769 ratio 0.005502117488172758python main.py 48.04s user 7.02s system 3% cpu 24:02.17 totalGithub Actionsで実行
6時間掛かってキャンセルされてる
9%|▉ | 1368/14461 [00:00<00:07, 1831.53it/s]Error: The operation was canceled.2023/4/5
2023/4/6