NISHIO Hirokazu[Translate]
自分用の検索エンジン
2021-06-24
そういう意味では裁断スキャンしてOCRした書籍の横断検索ができるようにしてるって話、まさに自分用の検索エンジンを使ってると言える
それの話、書いたかな?

自分検索エンジン(2018-10-18)
本の内容や自分の過去のブログ記事、他人の記事などを記憶していて、僕が今考えていることを読んで、そこから連想して提示するシステムが欲しい
これのPoorな実装は、僕がキーワードを入力して、そのキーワードを含む文章を返す「検索エンジン」だ
まずはこのPoorな「検索エンジン」があるべきではないか?

実はsilver_searcherでデータフォルダ内をがすっと検索するプログラムはある
書籍PDFを1ページ1行で出力してあるので、ヒットしたファイル名とその行番号を見ればどの本の何ページにあるかがわかる
これでは何が不足か?

最新に保つ手段が不明
前にデータを作ったのは大分前なのでもう忘れた
Facebookを検索対象にするにはdumpfbを使うはずだが…
書籍はどこまで検索対象に加えたかな…
公開できないタイプのデータ源は公開の場所に書いてないので自分自身が忘れてしまう
非公開でも書いておくべき
公開できるものは公開してGoogleなどの検索に任せた方が良い

クエリを決めなければいけない
例えばScrapboxにここまで書いたところで、ワンクリックで「この文章全体」をクエリとして検索ができて欲しい

2023-12-19
>例えばScrapboxにここまで書いたところで、ワンクリックで「この文章全体」をクエリとして検索ができて欲しい
西尾のベクトル検索で実現された
まだワンクリックではないが文章による検索ができる

"Engineer's way of creating knowledge" the English version of my book is now available on [Engineer's way of creating knowledge]

(C)NISHIO Hirokazu / Converted from [Scrapbox] at [Edit]