NISHIO Hirokazu[Translate]
トークン数見積り2024-05-17
2024-05-17
:
num book 336 num page 98526 num char 63668699 num token gpt4o 46738772 num token gpt4 62413985

gpt4 : gpt4o = 1.34 : 1
char : gpt4o = 1.36 : 1

エンジニアの知的生産術1冊で
:
num page 273 num char 249144 num token gpt4o 178800 num token gpt4 236547

トークナイザ
py
gpt4o = tiktoken.encoding_for_model("gpt-4o") # <Encoding 'o200k_base'> gpt4 = tiktoken.encoding_for_model("gpt-4") # <Encoding 'cl100k_base'>

text-embedding-3-small はcl100k_baseで、書籍336冊、98526ページで62M tokenで、今 $0.02 / 1M tokens だから$1.25
>このScrapboxだと17,229,603 tokens
> Embedding APIのコストは$0.4 / 1M Token
> つまり7ドルくらい
> 「コーディングを支える技術」を丸ごと埋め込んで$0.13
> (このScrapboxが書籍54冊分ということに驚き…)
1年ちょいでEmbedding APIのコストが1/20に下がったので、書籍1冊で1円を切るようになった

price
gpt-4o$5.00 / 1M tokens$15.00 / 1M tokens
gpt-3.5-turbo-0125$0.50 / 1M tokens$1.50 / 1M tokens

このScrapboxが17M token(cl100k), 13M token(o200k)だから、読むのにGPT3.5で$8.5、GPT4oで$65って感じ


"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]