トークン数見積り2024-05-17
2024-05-17
:num book 336
num page 98526
num char 63668699
num token gpt4o 46738772
num token gpt4 62413985
gpt4 : gpt4o = 1.34 : 1
char : gpt4o = 1.36 : 1
エンジニアの知的生産術1冊で
:num page 273
num char 249144
num token gpt4o 178800
num token gpt4 236547
トークナイザ
pygpt4o = tiktoken.encoding_for_model("gpt-4o") # <Encoding 'o200k_base'>
gpt4 = tiktoken.encoding_for_model("gpt-4") # <Encoding 'cl100k_base'>
text-embedding-3-small はcl100k_baseで、書籍336冊、98526ページで62M tokenで、今 $0.02 / 1M tokens だから$1.25
>このScrapboxだと17,229,603 tokens
> Embedding APIのコストは$0.4 / 1M Token
> 「コーディングを支える技術」を丸ごと埋め込んで$0.13
> (このScrapboxが書籍54冊分ということに驚き…)
1年ちょいでEmbedding APIのコストが1/20に下がったので、書籍1冊で1円を切るようになった
price| gpt-4o | $5.00 / 1M tokens | $15.00 / 1M tokens |
| gpt-3.5-turbo-0125 | $0.50 / 1M tokens | $1.50 / 1M tokens |
このScrapboxが17M token(cl100k), 13M token(o200k)だから、読むのにGPT3.5で$8.5、GPT4oで$65って感じ