セッションメモリと永続メモリ:アーキテクチャガイド
AIシステムを設計している場合、問題はメモリが必要かどうかではなく、どの種類のメモリが必要かです。セッションメモリと永続メモリは異なる目的を持ち、異なるレイヤーで動作し、異なるインフラストラクチャを必要とします。このページでは、両者を明確に説明します。
メモリの問題
多くのAIアプリケーションは、現在の会話のコンテキストウィンドウであるセッションメモリのみで構築されています。これは一回限りのクエリには機能しますが、ユーザーが継続性を期待して戻ってきたとき、エージェントが長いタスクを再開するとき、またはシステムが以前の実行からの教訓を適用する必要があるときには失敗します。セッションメモリが提供するものと、実際のプロダクションアプリケーションが必要とするものとのギャップが、永続メモリの存在する場所です。
MemoryLakeの異なる点
セッションを超えて無期限に存続する永続メモリ — MemoryLakeはメモリをモデルの外部に保存し、必要に応じて取得します。期限はなく、コンテキストウィンドウの制限もなく、セッションが終了してもリセットされません。メモリは日々、月々、年々蓄積されます。
異なる永続性ニーズのための型付きカテゴリ — すべての永続メモリが同じではありません。MemoryLakeは、バックグラウンド(静的アイデンティティ)、ファクト(バージョン管理された主張)、イベント(タイムライン)、会話(セッション履歴)、リフレクション(行動パターン)、スキル(再利用可能なワークフロー)を区別します。各タイプには適切なストレージセマンティクスがあります。
94.03%の精度でミリ秒単位の取得 — 永続メモリは、適切な情報を適切なタイミングで取得する場合にのみ有用です。MemoryLakeの#1 LoCoMoベンチマーク結果は、システムが最近のメモリだけでなく、関連するメモリを確実に引き出すことを意味します。
動作の仕組み
- 接続 — REST API、Python SDK、またはMCPを介してMemoryLakeをAIアプリケーションに統合します。セッションメモリは、モデルのコンテキストウィンドウ内で常に動作し続けます。
- 構造 — セッション終了時(または重要なイベントのためにセッション中)、関連情報を適切なMemoryLakeメモリタイプに書き込みます。セッションは終了しますが、メモリは終了しません。
- 再利用 — 次のセッション開始時に、関連する永続メモリを取得し、選択的にコンテキストに注入します。モデルは空白の状態ではなく、蓄積された知識から始まります。
セッションメモリと永続メモリ
| Characteristic | Session Memory | Persistent Memory (MemoryLake) |
|---|---|---|
| Lifespan | Ends when the session closes | Survives indefinitely across sessions |
| Storage location | Inside the model's context window | External memory layer, retrieved on demand |
| Capacity | Limited by context window token count | Scales to 1B+ complex documents in production |
| Cross-session access | Not available | Available to any authorized session or agent |
| Structure | Unstructured text in context | Six typed categories with defined semantics |
| Conflict detection | None — latest input wins | Automatic conflict detection and versioning for Facts |
| Retrieval accuracy | N/A (all context is present) | 94.03% LoCoMo benchmark accuracy |
| Cost at scale | Grows with context length per call | Retrieved selectively; context stays lean |
| Compliance and audit | None by default | Versioned, source-attributed, GDPR/SOC 2 compliant |
対象
この比較は、ユーザー向け製品、内部ツール、またはエージェントシステムのAIメモリインフラストラクチャを設計する際の開発者やアーキテクトにとって有用です。同じユーザーまたは同じエージェントが複数のセッションにわたって関与する場合、永続メモリはあなたのアーキテクチャに必要です。
関連するユースケース
よくある質問
セッションメモリは十分ですか?
セッションメモリは十分ですか?
単発のアプリケーション — 一回限りのクエリツール、ドキュメント要約ツール、コードフォーマッター — にはセッションメモリが十分です。継続性、パーソナライズ、または蓄積された知識が重要なアプリケーションでは、永続メモリが必要です。
MemoryLakeはコンテキストウィンドウを置き換えられますか?
MemoryLakeはコンテキストウィンドウを置き換えられますか?
いいえ — そして、そうすべきではありません。セッションメモリ(コンテキストウィンドウ)と永続メモリは一緒に機能します。コンテキストウィンドウは即座に関連するものを保持し、MemoryLakeはすべての以前のセッションで学んだものを保持し、適切な部分を選択的に引き出します。
MemoryLakeは永続メモリから何を引き出すかをどのように決定しますか?
MemoryLakeは永続メモリから何を引き出すかをどのように決定しますか?
メモリタイプとセマンティックインテントでMemoryLakeにクエリを送ります。取得レイヤーは、現在のセッションコンテキストに対する関連性に基づいて結果をランク付けし、最も適用可能なメモリアイテムを返します — 保存されているすべてのもののダンプではありません。