image.png

これは mem0(@mem0ai)の記事 State of Memory in Agent Harness(In Context #11)の日本語版です。

原文 X:https://x.com/mem0ai/status/2061822612398014782 mem0 公式サイト:https://mem0.ai mem0 ドキュメント:https://docs.mem0.ai

翻訳:@himanshutwtxs(https://x.com/himanshutwtxs)

補足:私は日本語ネイティブではなく、この翻訳は Claude と QuillBot を使って作成しました。不正確な箇所や読みにくい箇所があれば、ぜひ指摘してください。

この内容をシェアしていただける場合は、mem0 の SNS アカウント(X:@mem0ai)にも触れていただけると嬉しいです。ありがとうございます。

https://x.com/mem0ai/status/2061822612398014782

https://x.com/mem0ai/status/2061822612398014782


Agent harness は、AI ソフトウェアが実際に動く場所だ。Cursor、Devin、Claude Code、Codex といった環境は、context を管理し、ツールをオーケストレーションし、複数の agent を協調させ、そしてますます記憶も管理するようになっている。ソフトウェアを実際に出荷するプロダクトは、モデルそのものから harness へと移りつつある。

記憶は、harness 設計のなかで最も難しい部分だ。それはどこに置かれるのか。session が終わったとき、何が残るのか。これは大部分が未解決の問題であり、主要な harness はそれぞれ違うやり方で解こうとしている。

この記事では、各 harness が何を出荷したか、どこに弱点があるか、そしてその差が記憶インフラに何を求めているのかを整理する。


エージェント記憶とは実際に何か

「記憶」と呼ばれるものには、まったく異なる三つのものがある。それぞれ失敗の仕方が違うので、区別が重要だ。

Working memory(ワーキングメモリ) は、session 中に context window の中に存在する内容だ。session が終わると消える。compaction の問題(window が埋まったときに何が残るか)はこの層に属する。

External memory(外部記憶) は、重みの外に永続化されるすべてのものだ。vector store、knowledge graph、ファイルなど。session をまたいで残り、重み自体は変わらない。2026 年、本番環境の記憶はほぼすべてこの層にある。

Parametric memory(パラメトリック記憶) は、勾配降下によって重みに符号化された知識で、harness が与える学習ループによって形作られる。例を検索するのではなく、ルールを適用して汎化する。2026 年、本番環境での導入はゼロだ。

(認知科学でいう意味記憶 / エピソード記憶 / 手続き記憶の分類は「どんな種類の情報を保存するか」を表す。一方、上の三層は「それがどこに存在するか」を表す。)

論文「Contextual Agentic Memory is a Memo, Not True Memory」(arXiv:2604.27707) は、この上限を定式化している。検索は、パラメトリック記憶が O(d) 回の重み更新で実現することに匹敵するために、Ω(k²) のオーダーの保存例を必要とする。以下のすべてのシステムは、この上限の内側で動いている。


主要な harness は何を出荷したか(概要)

image.png


1. Claude Code(@AnthropicAI) 二つの系統がある。CLAUDE.md は人が書いた設定(規約や指示)で、session 開始時に読み込まれる。Auto-memory はバックグラウンドの抽出 agent が書いたメモで、~/.claude/projects/<repo>/memory/ 以下に、上限 200 行 / 25KB の MEMORY.md インデックスを中心に、user・feedback・project・reference の四つのカテゴリで保存される。