URL を一つ変えるだけで、あらゆる LLM に永続的な記憶を
Memory Router は、あなたのアプリとモデルの間に位置する透過的プロキシです。既存の SDK を MemoryLake に向けるだけで、すべての会話が長期記憶と最適化されたコンテキストウィンドウを得ます。使い方は二通り:自分のプロバイダーキーを持ち込む(BYOK)か、MemoryLake ホストのモデルを MemoryLake キー一つだけで使う。
ステートレスな API は毎回記憶を作り直させる
LLM の呼び出しはすべてステートレスです。連続性を装うために、毎ターン履歴全体を再送する — 遅く、高コストで、最終的にはコンテキストウィンドウを溢れさせます。ベクトル DB と検索パイプラインを後付けすれば解決しますが、それは自分で構築・保守する数週間分の配管工事です。
記憶層がない場合
- 呼び出しごとにチャット履歴全体を再送 — 会話が長くなるほどトークンコストが上昇。
- 長いセッションはコンテキストウィンドウの上限にぶつかり、作業の途中で切り捨てが始まる。
- 記憶は一つのアプリ内だけ — モデルやセッションを変えるとコンテキストが消える。
自分で構築する場合
- ベクトル DB、埋め込みパイプライン、チャンク化、検索ロジックを立ち上げる。
- 抽出・重複排除・関連性ランキングを書き、その後も調整し続ける。
- サポートするすべてのプロバイダーとモデルで保守する。
Memory Router はそのすべてを一つの base URL 変更に集約します。プロキシそのものが記憶層です。
四ステップの透過的プロキシ
MemoryLake が利用できないときは、リクエストはそのままプロバイダーへ透過します — ダウンタイムゼロ。
インターセプト
アプリはプロバイダーではなく Memory Router にリクエストを送る — 同じペイロード、同じ SDK、同じレスポンス形状。
コンテキスト最適化
Router は冗長な履歴を削り、過去の記憶を検索し、関連するコンテキストだけをプロンプトに注入します。
転送
強化されたリクエストはモデルへ — 自分のプロバイダー(BYOK)または MemoryLake ホストのモデルへ。生の再送よりも入力トークンが少なくなります。
記憶
新しい記憶はバックグラウンドで非同期に抽出・保存される — レスポンスが遅延することはありません。
BYOK か MemoryLake ホストか — あなた次第
自分のキー持ち込みを強制するプロキシと違い、Memory Router は両方に対応します。どちらも変更は base URL だけ。他のすべて — プロンプト、ストリーミング、ツール呼び出し — はそのままです。
自分のキーを持ち込む
自分のプロバイダーアカウントを使用。あなたのキーは転送中に暗号化され、呼び出しごとにプロバイダーへ転送され、当社のサーバーには一切保存されません。
- 既存の OpenAI / Anthropic / Google アカウントをそのまま使用。
- あなたのキー、あなたの課金、あなたのレート制限。
- キーは暗号化+透過のみ — 保存もログ記録もされません。
MemoryLake ホスト
プロバイダーアカウントは不要。MemoryLake が主要モデルを代わりに動かすので、MemoryLake API キー一つだけで始められます。
- すべてをキー一つで — 他に登録するものはありません。
- 主要モデルが組み込み済みで、すぐ呼び出せます。
- 記憶付きで出荷する最もシンプルな方法。
キーの安全性は設計から:BYOK モードでは、プロバイダーキーは転送中に暗号化され、毎回そのままプロバイダーへ渡されます。MemoryLake が保存・ログ記録・再利用することは一切ありません。
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://router.memorylake.ai/v1/openai",
apiKey: process.env.OPENAI_API_KEY, // your provider key
defaultHeaders: {
// encrypted in transit · passthrough only · never stored
"x-memorylake-api-key": process.env.MEMORYLAKE_API_KEY,
},
});import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://router.memorylake.ai/v1",
apiKey: process.env.MEMORYLAKE_API_KEY, // one key — that's it
});
// Pick any built-in model, e.g. "claude-opus-4-8" or "gpt-5".構築せずに手に入る記憶インフラ
一行で統合
base URL を変えるだけ。SDK もコードもそのまま。
BYOK またはホスト
自分のプロバイダーキーを持ち込む(暗号化・非保存)か、MemoryLake ホストのモデルをキー一つで使う。
自動コンテキスト最適化
冗長な履歴を除去し、関連する記憶だけを注入して、呼び出しごとのトークンを削減。
共有記憶プール
Router と MemoryLake API は同じ記憶を読み書きする — 唯一の真実の源。
グレースフルなフォールバック
MemoryLake が利用できないときは、リクエストはそのままプロバイダーへ透過。ダウンタイムゼロ。
完全な可観測性
レスポンスヘッダーが会話 ID、コンテキスト変更、トークン数、作成・取得された記憶を報告します。
既にお使いのプロバイダーで動作
BYOK モードではプロバイダーのアカウントとキーをそのまま使用。ホストモードでは MemoryLake がこれらのモデルを代わりに動かします — どちらも同じ記憶層です。
| プロバイダー | ステータス |
|---|---|
| OpenAI / GPT | 完全対応 |
| Anthropic / Claude | 完全対応 |
| Google Gemini | 完全対応 |
| Groq、DeepSeek、OpenRouter | 完全対応 |
| 任意の OpenAI 互換エンドポイント | 対応 |
| OpenAI Assistants API | 未対応 |
すべてのレスポンスが何が起きたかを教える
Memory Router は診断ヘッダーを返すので、各リクエストがどう処理されたかを正確に確認できます — ブラックボックスではありません。
会話 ID
リクエストが帰属したスレッド。ターンをグループ化して検証できます。
コンテキスト変更
この呼び出しで記憶が注入されたか、履歴が削られたか。
トークン数
最適化後に送信したトークン数と、生の再送との比較。
触れた記憶
取得した記憶チャンク数と、新規作成した数。
三ステップで稼働
- 1
MemoryLake キーを取得
MemoryLake にサインアップして API キーを作成。Free プランには開始用の記憶ストレージが含まれます。
- 2
モードを選んで base URL を差し替え
SDK を Router エンドポイントに向けます。BYOK ならプロバイダーキーを残し、MemoryLake キーをヘッダーに追加。ホストなら MemoryLake キーだけでOK。
- 3
普通に呼び出す
今日と同じようにリクエストを送るだけ。記憶は自動で取得・保存され、レスポンスヘッダーで確認できます。
API 直結 vs. Memory Router
会話が長くなるにつれ、呼び出しごとに送信するトークン
トークン約 90% 削減| プロバイダー直結 | Memory Router 使用 | |
|---|---|---|
| 長期記憶 | 自分で構築・ホスト | 組み込み・自動 |
| コンテキストウィンドウ | 全部再送して切り捨て | 最適化 — 重要なものだけ |
| キーとアカウント | プロバイダーアカウントが必須 | BYOK または MemoryLake キー一つだけ |
| コード変更 | 新 SDK + 検索パイプライン | base URL を一つ変更 |
| セッション・モデルをまたいで | アプリごとに記憶が孤立 | 共有記憶プール |
| 記憶層プロバイダーの障害 | 自分で対処 | グレースフルな透過 |
| 可視性 | デフォルトでなし | 診断レスポンスヘッダー |
よくある質問
コードを変更する必要がありますか?
base URL と一つのヘッダーだけです。プロンプト、ストリーミング、ツール呼び出し、レスポンス処理は同一のまま — Memory Router はプロバイダーと同じ API を話します。
どのプロバイダーに対応していますか?
OpenAI、Anthropic、Google Gemini、Groq、DeepSeek、OpenRouter、および任意の OpenAI 互換エンドポイント。OpenAI Assistants API は未対応です。
BYOK と MemoryLake ホストの違いは?
BYOK(自分のキー持ち込み)は、自分のプロバイダーキーと MemoryLake キーを指定する方式で、課金とレート制限はプロバイダーアカウントに残ります。ホストは MemoryLake キーだけでOK:主要モデルを当社が動かすため、プロバイダー登録は不要です。
BYOK モードでプロバイダーキーは安全ですか?
はい。プロバイダーキーは転送中に暗号化され、呼び出しごとにプロバイダーへ転送されます。MemoryLake が保存・ログ記録・再利用することは一切なく、透過するだけです。
MemoryLake がダウンしたらどうなりますか?
BYOK モードでは Memory Router はフェイルオープン:リクエストはそのままプロバイダーへ透過し、アプリはダウンタイムゼロで動き続けます。
どうやってトークンを削減しますか?
毎ターン履歴全体を再送する代わりに、Router は冗長なコンテキストを除去し、関連する記憶だけを注入します — 会話が長くなるほど呼び出しごとのトークンが少なくなります。
記憶は MemoryLake API と共有されますか?
はい。Router と MemoryLake API は同じ記憶プール上で動作するため、一方で保存したものはもう一方で取得できます。
無料プランはありますか?
はい。Memory Router は Free プランで利用できるので、スケールする前に統合・テストできます。
すべての LLM に記憶を — URL を一つ変えるだけ。
コンテキストの再送と検索の再構築をやめましょう。SDK を Memory Router に向けて、今日から記憶を届けましょう。