MemoryLake
Memory Router · あらゆる LLM のためのドロップイン記憶プロキシ

URL を一つ変えるだけで、あらゆる LLM に永続的な記憶を

Memory Router は、あなたのアプリとモデルの間に位置する透過的プロキシです。既存の SDK を MemoryLake に向けるだけで、すべての会話が長期記憶と最適化されたコンテキストウィンドウを得ます。使い方は二通り:自分のプロバイダーキーを持ち込む(BYOK)か、MemoryLake ホストのモデルを MemoryLake キー一つだけで使う。

Router キーを取得ドキュメントを読む →既にお使いの OpenAI・Anthropic・Google SDK で動作
課題

ステートレスな API は毎回記憶を作り直させる

LLM の呼び出しはすべてステートレスです。連続性を装うために、毎ターン履歴全体を再送する — 遅く、高コストで、最終的にはコンテキストウィンドウを溢れさせます。ベクトル DB と検索パイプラインを後付けすれば解決しますが、それは自分で構築・保守する数週間分の配管工事です。

記憶層がない場合

  • 呼び出しごとにチャット履歴全体を再送 — 会話が長くなるほどトークンコストが上昇。
  • 長いセッションはコンテキストウィンドウの上限にぶつかり、作業の途中で切り捨てが始まる。
  • 記憶は一つのアプリ内だけ — モデルやセッションを変えるとコンテキストが消える。

自分で構築する場合

  • ベクトル DB、埋め込みパイプライン、チャンク化、検索ロジックを立ち上げる。
  • 抽出・重複排除・関連性ランキングを書き、その後も調整し続ける。
  • サポートするすべてのプロバイダーとモデルで保守する。

Memory Router はそのすべてを一つの base URL 変更に集約します。プロキシそのものが記憶層です。

仕組み

四ステップの透過的プロキシ

あなたのアプリ
OpenAI / Anthropic / Google SDK
リクエスト
Memory Router
透過的プロキシ
冗長な履歴を削減関連する記憶を注入
強化済みリクエスト
モデル
BYOK またはホスト
自分のプロバイダー · BYOKMemoryLake ホスト
記憶ストア· 非同期の読み書き

MemoryLake が利用できないときは、リクエストはそのままプロバイダーへ透過します — ダウンタイムゼロ。

1

インターセプト

アプリはプロバイダーではなく Memory Router にリクエストを送る — 同じペイロード、同じ SDK、同じレスポンス形状。

2

コンテキスト最適化

Router は冗長な履歴を削り、過去の記憶を検索し、関連するコンテキストだけをプロンプトに注入します。

3

転送

強化されたリクエストはモデルへ — 自分のプロバイダー(BYOK)または MemoryLake ホストのモデルへ。生の再送よりも入力トークンが少なくなります。

4

記憶

新しい記憶はバックグラウンドで非同期に抽出・保存される — レスポンスが遅延することはありません。

二つの接続方法

BYOK か MemoryLake ホストか — あなた次第

自分のキー持ち込みを強制するプロキシと違い、Memory Router は両方に対応します。どちらも変更は base URL だけ。他のすべて — プロンプト、ストリーミング、ツール呼び出し — はそのままです。

BYOK

自分のキーを持ち込む

自分のプロバイダーアカウントを使用。あなたのキーは転送中に暗号化され、呼び出しごとにプロバイダーへ転送され、当社のサーバーには一切保存されません。

  • 既存の OpenAI / Anthropic / Google アカウントをそのまま使用。
  • あなたのキー、あなたの課金、あなたのレート制限。
  • キーは暗号化+透過のみ — 保存もログ記録もされません。
必要なキー:プロバイダーキー + MemoryLake キー
キー不要

MemoryLake ホスト

プロバイダーアカウントは不要。MemoryLake が主要モデルを代わりに動かすので、MemoryLake API キー一つだけで始められます。

  • すべてをキー一つで — 他に登録するものはありません。
  • 主要モデルが組み込み済みで、すぐ呼び出せます。
  • 記憶付きで出荷する最もシンプルな方法。
必要なキー:MemoryLake キーのみ

キーの安全性は設計から:BYOK モードでは、プロバイダーキーは転送中に暗号化され、毎回そのままプロバイダーへ渡されます。MemoryLake が保存・ログ記録・再利用することは一切ありません。

BYOK — あなたのプロバイダーキー
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://router.memorylake.ai/v1/openai",
  apiKey: process.env.OPENAI_API_KEY,        // your provider key
  defaultHeaders: {
    // encrypted in transit · passthrough only · never stored
    "x-memorylake-api-key": process.env.MEMORYLAKE_API_KEY,
  },
});
MemoryLake ホスト — キー一つ
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://router.memorylake.ai/v1",
  apiKey: process.env.MEMORYLAKE_API_KEY,    // one key — that's it
});

// Pick any built-in model, e.g. "claude-opus-4-8" or "gpt-5".
得られるもの

構築せずに手に入る記憶インフラ

一行で統合

base URL を変えるだけ。SDK もコードもそのまま。

BYOK またはホスト

自分のプロバイダーキーを持ち込む(暗号化・非保存)か、MemoryLake ホストのモデルをキー一つで使う。

自動コンテキスト最適化

冗長な履歴を除去し、関連する記憶だけを注入して、呼び出しごとのトークンを削減。

共有記憶プール

Router と MemoryLake API は同じ記憶を読み書きする — 唯一の真実の源。

グレースフルなフォールバック

MemoryLake が利用できないときは、リクエストはそのままプロバイダーへ透過。ダウンタイムゼロ。

完全な可観測性

レスポンスヘッダーが会話 ID、コンテキスト変更、トークン数、作成・取得された記憶を報告します。

互換性

既にお使いのプロバイダーで動作

BYOK モードではプロバイダーのアカウントとキーをそのまま使用。ホストモードでは MemoryLake がこれらのモデルを代わりに動かします — どちらも同じ記憶層です。

プロバイダーステータス
OpenAI / GPT完全対応
Anthropic / Claude完全対応
Google Gemini完全対応
Groq、DeepSeek、OpenRouter完全対応
任意の OpenAI 互換エンドポイント対応
OpenAI Assistants API未対応
透明性

すべてのレスポンスが何が起きたかを教える

Memory Router は診断ヘッダーを返すので、各リクエストがどう処理されたかを正確に確認できます — ブラックボックスではありません。

会話 ID

リクエストが帰属したスレッド。ターンをグループ化して検証できます。

コンテキスト変更

この呼び出しで記憶が注入されたか、履歴が削られたか。

トークン数

最適化後に送信したトークン数と、生の再送との比較。

触れた記憶

取得した記憶チャンク数と、新規作成した数。

セットアップ

三ステップで稼働

  1. 1

    MemoryLake キーを取得

    MemoryLake にサインアップして API キーを作成。Free プランには開始用の記憶ストレージが含まれます。

  2. 2

    モードを選んで base URL を差し替え

    SDK を Router エンドポイントに向けます。BYOK ならプロバイダーキーを残し、MemoryLake キーをヘッダーに追加。ホストなら MemoryLake キーだけでOK。

  3. 3

    普通に呼び出す

    今日と同じようにリクエストを送るだけ。記憶は自動で取得・保存され、レスポンスヘッダーで確認できます。

違い

API 直結 vs. Memory Router

会話が長くなるにつれ、呼び出しごとに送信するトークン

トークン約 90% 削減
直接呼び出し毎ターン履歴全体
Memory Router関連する記憶だけ
プロバイダー直結Memory Router 使用
長期記憶自分で構築・ホスト組み込み・自動
コンテキストウィンドウ全部再送して切り捨て最適化 — 重要なものだけ
キーとアカウントプロバイダーアカウントが必須BYOK または MemoryLake キー一つだけ
コード変更新 SDK + 検索パイプラインbase URL を一つ変更
セッション・モデルをまたいでアプリごとに記憶が孤立共有記憶プール
記憶層プロバイダーの障害自分で対処グレースフルな透過
可視性デフォルトでなし診断レスポンスヘッダー

よくある質問

コードを変更する必要がありますか?

base URL と一つのヘッダーだけです。プロンプト、ストリーミング、ツール呼び出し、レスポンス処理は同一のまま — Memory Router はプロバイダーと同じ API を話します。

どのプロバイダーに対応していますか?

OpenAI、Anthropic、Google Gemini、Groq、DeepSeek、OpenRouter、および任意の OpenAI 互換エンドポイント。OpenAI Assistants API は未対応です。

BYOK と MemoryLake ホストの違いは?

BYOK(自分のキー持ち込み)は、自分のプロバイダーキーと MemoryLake キーを指定する方式で、課金とレート制限はプロバイダーアカウントに残ります。ホストは MemoryLake キーだけでOK:主要モデルを当社が動かすため、プロバイダー登録は不要です。

BYOK モードでプロバイダーキーは安全ですか?

はい。プロバイダーキーは転送中に暗号化され、呼び出しごとにプロバイダーへ転送されます。MemoryLake が保存・ログ記録・再利用することは一切なく、透過するだけです。

MemoryLake がダウンしたらどうなりますか?

BYOK モードでは Memory Router はフェイルオープン:リクエストはそのままプロバイダーへ透過し、アプリはダウンタイムゼロで動き続けます。

どうやってトークンを削減しますか?

毎ターン履歴全体を再送する代わりに、Router は冗長なコンテキストを除去し、関連する記憶だけを注入します — 会話が長くなるほど呼び出しごとのトークンが少なくなります。

記憶は MemoryLake API と共有されますか?

はい。Router と MemoryLake API は同じ記憶プール上で動作するため、一方で保存したものはもう一方で取得できます。

無料プランはありますか?

はい。Memory Router は Free プランで利用できるので、スケールする前に統合・テストできます。

すべての LLM に記憶を — URL を一つ変えるだけ。

コンテキストの再送と検索の再構築をやめましょう。SDK を Memory Router に向けて、今日から記憶を届けましょう。