NISHIO Hirokazu[日本語][English]

AIエージェントと脱ターン制コミュニケーション

from 日記2025-02-10 AIエージェントと脱ターン制コミュニケーション

teramotodaiki エージェント検索ってこんな感じかなーってエアプで作ってみた所感 ・全部o3-miniでいい。他のモデルは必要ない ・信頼できるナレッジの構築こそが全て。他は些事 ・サーバーレス(ステートレス?)なアーキテクチャを前提にするとターン制コミュニケーションしか出来なくてショボい ・Devinはすごい

teramotodaiki ChatGPTがターン制コミュニケーションだから「そういうもんだ」と99%の開発者は思っているのではなかろうか。 Devinはセッションの設計がマジで上手い。Slackスレッドに「いる」んだよな。あの体験を作るにはアーキテクチャから考え直さないといけない。

teramotodaiki 広い意味ではこれもメモリーの設計なのかも知れない。どこまで記憶を引き継ぐのか。ある種の自己同一性のようなものの設計。ユーザーの期待する同一性とソフトウェアの設計を一致させるためのUI… ソフトウェア開発でここまで人間の認知に深く迫れるのが楽しくてしょうがない

ここ、とても悩ましいんだけど実際ターン制コミュニケーションではない形になると思うんだよね、kintone上で人間が会話するのも交互に話してるのではないわけで。

ここでいう「ターン制コミュニケーション」とは「Aさんが話し、Bさんが話し、Aさんが話し、...」というもののこと AIは人間のインプットに反応すればいいだけなのでアーキテクチャは楽なんだけど、それではDevin的にはならない。 AさんはN件話せるし、BさんもM件話せるし、Aさんが話したからといってBさんのターンになったりはしない、という感じ kintoneなどでの人間同士の会話がまさにそれで、このやりとりのしかたはChatGPTとは違うよね、ということ

Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance Proactive Agent


(C)NISHIO Hirokazu / Converted from Markdown (ja)
Source: [GitHub] / [Scrapbox]