1: 時事の話題: Azure Cognitive Search
Dense Passage Retriever (DPR)...事前学習モデルを利用した密なベクトルベース
2: ベクトル検索
事例1
事例2
事例3
素人のアイデアは口頭発表では独創性高く見えるが実現可能でない
「レゴマインドストームで独創的な進み方をするロボットを作れ」という課題でマインドストームを使ったことのない素人とロボコン優勝・準優勝者(以下、玄人)とで比較をした論文。...玄人と素人では独創性に差はなかった。...しかし、素人のほとんどはそのアイデアを実現できなかった。
事例4
現状のkintoneだとデータの横でコミュニケーションできてデータの更新ができて自動バージョン管理されるわけだが、理想はデータベースのスキーマやカスタマイズのJavaScriptに関しても同様の共同編集ができる状態なのだと思う。
公共事業向けデジタルソリューションを活用した自治体業務改革
両自治体ではデジタルソリューションとしてサイボウズ株式会社の「kintone」が活用されました。kintoneはExcelを使う程度の知識があればプログラミングの知識がなくても業務アプリケーションを構築できます。メール、Excelとバラバラになっていた情報を統合し、創意工夫により独自の業務環境を作ることができます。
なるほどなー、kintoneをどう説明したらいいかわからないなと思っていたが「メールとExcelの統合」と説明するのか
事例5
コストが数値で測りやすいのに対し、品質は測りにくいので軽視しやすい
Q: ベクトル検索なら、みんな検索うまくなる?
この手の話は、うまく言った例だけ(あるいは多めに)聞くと魔法のように感じるが、実際にはうまく行かなかったときのほうが同じくらい(あるいは圧倒的に多い)ということもよくあるので、気をつけないといけない(自戒を込めて)
振り返ってみる
弊社の独自アルゴリズム「意図予測検索」...の技術を米OpenAI社が提供するtext-embedding-ada-002モデルを使用し、さらに拡張させる HelpfeelがAIのハルシネーションを回避しながら検索精度を30%向上させる「Contact Sense AI」を公開。問い合わせの自己解決を促進|株式会社Helpfeelのプレスリリース
5: AIによる赤リンクの延伸
kazunori_279 やっぱファインチューンとかRAGとかごにょごにょするより、単純にembでベクトル検索して結果を表示するだけで良くね?って思った。
nishio 僕もながらく「ベクトル検索だけでいいだろ」派だったのだけど、単なる質問回答ではなく知的生産のアシスタントとして使う場合はRAGの方がいいと感じる。生成部分が「目的に合わせて検索結果を要約すること」として機能するので。なおこれはクエリとは別に目的が与えられてることが前提。
開拓者モード (Pioneer Mode) とは、「AIによる赤リンクの延伸」の発展形
「✍️🤖」のページにリンクを置いておくと、AIが定期的にチェックして自動的に生成してくれる
二人の人間が意気投合して、活発な議論をして、互いの発言が互いに影響を与え合った場合、その結果として出てきたのもののどの部分が片方の人由来であるのかは識別しにくくなる。
人間とAIの場合も同じことが起こる。これを識別しよう、識別できる状態にしよう、という発想はUIを設計する上で有害な可能性がある。
政府がお金をかけるべきなのは、研究ではなく非目的論的ないじくり回しである --- 反脆弱性[上] p.375
タイトルに「社会保障費」を入れた抜き書きページを作った
時間軸とトピック指向の間でのバランスは、情報の整理や解釈における重要な課題である。時間軸に沿った情報の整理は、情報の流れを追体験するのに適しているが、特定のトピックやテーマ性を探求する際には、トピック指向の新しい構造を作るために時系列の構造を破壊する必要があるかもしれない。一方、トピック指向の整理は、情報を特定のテーマやコンテキストに基づいて整理することを可能にする。これらの間での適切なバランスを見つけることが、情報の効率的な整理と理解を促進する。
そうすることで、トピックや文脈を超えたつながりを形成しやすくなります
nishio 自分の研究ノートからのベクトル検索は認知の解像度を高める道具として機能する
それは「似ているもの」が提示されることによって、今考えていることを少しずつ違う方向から観察することになるからだ...「言語化をする」というプロセスに「世界を記述する解像度を高める」と「高い解像度での観察によって得られた理解を他の人に伝わる形で記述し直す」とがあり、これは別物なのでそれぞれわけて考える必要がある
認知の解像度を上げるために有益な思考のパターン
ある二つの概念に対して「似ている」と感じた時、「これは全く同じものだ」と感じなかったということはそこに「違い」を感じている。
その「違い」は現時点では言語化されていない。
「違いは何か?」と考えることで物事をより詳細に観察できるようになる。
以下は執筆前のメモ
以下は、入力された情報を要約したものです:
7/29 AIがScrapboxに書き込む
8/11 /omoikane/この後の進み方をGPT4に相談した2023-08-11
8/12
8/12 AIが毎日研究ノートを書く 8/16 ScrapboxとAIに関する思考の結節点2023/8/16 8/16 ベクトル検索結果を積む 8/16 上書きモード 8/18 AI生成ページのベクトル検索からの無視 8/18 AIの支援で新しい結合ができた事例 8/21 マルチヘッド
8/25 更新ページ数制限 8/26 話題のピン留め効果
8/29 AI生成ページのベクトル検索からの無視の解除
8/30 AIによる赤リンクの延伸
8/31 メインブランチ停止
8/31 質問は言語化を促すが質問にも種類がある
8/31 enchiへの導入
8/31 AIの役割の明確化が大事
8/31 AIノートの更新間隔について
8/31 中学生の職場体験でSFプロトタイピングをやってもらった事例
9/1 流動的プロセスとしてのページ
9/1 思索と開発のトレードオフ #苦痛
9/1 このプロジェクトにおけるAIの役割は何か
9/1 複数の個性のAIがある?
9/1 AIノートのページごとに目的を明示したらいいのでは
9/1 AIページの底に埋もれてる #苦痛の原因
9/1 異なるコンテンツの間のつながり発見
9/1 自分の日記に他人のAIを召喚
9/2 ベクトル検索とRAGの肌感の違い
9/2 切り分けられていない連なりの一部にヒットすることで切り出しの機会になる +1
9/2 AIが無限に思考を発展させてくるので休めない #苦痛の原因
9/2 他のプロジェクトのURLを読めるという気づき
9/2 マルチヘッドの思考 epoch 9/2 たまに浮かび上がるページ
9/3
9/4
Iterative Commenter Pioneer mode
~ AIシャーマン
9/11 松尾研のLLM講座 AIによる異なる視点の提供の実例 歌詞をAIに解釈させる実験 Recurrent NotesとIterative Commenterの違い
9/12 不明瞭で長期的なタスクをAIにねりねりさせる PDFからScrapboxへ
9/13 ビジネスはシーズとニーズのマッチング
9/15 長い寝起き神託の考察 最近のモーニングルーティン2023-09-15
9/16 人生に関する歌詞を集めて気に入ったフレーズをピックアップする
9/20 private projectでの統合 横断ベクトル検索実験メモ2023-09-20
2023/9/22 LLMに似ているものの違いを言語化させる (仮)まだ名前のない操作 Scrapboxを活用した思考とコミュニケーションの再構築
2023-09-24 「人間」の概念が曖昧
2023-09-29 非公開omniを使ってみての感想