NISHIO Hirokazu[Translate]
ImageHash

画像類似検索
PNGをローカルでmd5コマンドでダイジェストしたものと、それをGyazoにアップロードした時のURLは一致する
しかし画像をScrapboxにコピーペーストした時に自動でGyazoにアップロードされたものはURLが異なる
サーバサイドでPNGにする際の設定が異なるなどの理由でファイルの内容が異なるのか
この画像をダウンロードしてmd5を見たらURLと一致していた
元画像、Twitterに画像を投稿してtwimgでサーブされた画像、それをローカルに保存したもの、Scrapboxにペーストされたもの、に同じ画像があっても判断しにくい
Pythonで画像類似検索をする
imgsimとImageHashがある
前者はTorchを使って768次元の特徴ベクトルを作る風
clip-ViT-L-14の仲間かな
後者は機械学習を使わない感じ
後者が向いてそう
ペーストでアップロードされたハッシュ値の異なる画像もImageHashなら同一と判定できることがわかった

"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]