Do I need to change my code?

Only the base URL and one header. Your prompts, streaming, tool calls, and response handling stay identical — Memory Router speaks the same API as your provider.

Which providers are supported?

OpenAI, Anthropic, Google Gemini, Groq, DeepSeek, OpenRouter, and any OpenAI-compatible endpoint. The OpenAI Assistants API is not yet supported.

What is the difference between BYOK and MemoryLake-hosted?

BYOK (Bring Your Own Key) means you supply your own provider key plus a MemoryLake key — billing and rate limits stay with your provider account. MemoryLake-hosted needs only a MemoryLake key: we run the major models for you, so you skip provider sign-up entirely.

In BYOK mode, is my provider key safe?

Yes. Your provider key is encrypted in transit and forwarded to the provider on each call. MemoryLake never stores, logs, or reuses it — it is passthrough only.

What happens if MemoryLake is down?

In BYOK mode Memory Router fails open: the request passes straight through to your provider so your application keeps working with zero downtime.

How does it reduce tokens?

Instead of replaying the entire history each turn, the Router removes redundant context and injects only the relevant memories — fewer tokens per call as conversations grow.

Is there a free plan?

Yes. Memory Router is available on the Free tier so you can integrate and test before scaling up.

Memory Router · あらゆる LLM のためのドロップイン記憶プロキシ

URL を一つ変えるだけで、あらゆる LLM に永続的な記憶を

Memory Router は、あなたのアプリとモデルの間に位置する透過的プロキシです。既存の SDK を MemoryLake に向けるだけで、すべての会話が長期記憶と最適化されたコンテキストウィンドウを得ます。使い方は二通り：自分のプロバイダーキーを持ち込む（BYOK）か、MemoryLake ホストのモデルを MemoryLake キー一つだけで使う。

Router キーを取得ドキュメントを読む →既にお使いの OpenAI・Anthropic・Google SDK で動作

課題

ステートレスな API は毎回記憶を作り直させる

LLM の呼び出しはすべてステートレスです。連続性を装うために、毎ターン履歴全体を再送する — 遅く、高コストで、最終的にはコンテキストウィンドウを溢れさせます。ベクトル DB と検索パイプラインを後付けすれば解決しますが、それは自分で構築・保守する数週間分の配管工事です。

記憶層がない場合

呼び出しごとにチャット履歴全体を再送 — 会話が長くなるほどトークンコストが上昇。
長いセッションはコンテキストウィンドウの上限にぶつかり、作業の途中で切り捨てが始まる。
記憶は一つのアプリ内だけ — モデルやセッションを変えるとコンテキストが消える。

自分で構築する場合

ベクトル DB、埋め込みパイプライン、チャンク化、検索ロジックを立ち上げる。
抽出・重複排除・関連性ランキングを書き、その後も調整し続ける。
サポートするすべてのプロバイダーとモデルで保守する。

Memory Router はそのすべてを一つの base URL 変更に集約します。プロキシそのものが記憶層です。

仕組み

四ステップの透過的プロキシ

あなたのアプリ

OpenAI / Anthropic / Google SDK

リクエスト

Memory Router

透過的プロキシ

冗長な履歴を削減関連する記憶を注入

強化済みリクエスト

モデル

BYOK またはホスト

自分のプロバイダー · BYOKMemoryLake ホスト

記憶ストア· 非同期の読み書き

MemoryLake が利用できないときは、リクエストはそのままプロバイダーへ透過します — ダウンタイムゼロ。

インターセプト

アプリはプロバイダーではなく Memory Router にリクエストを送る — 同じペイロード、同じ SDK、同じレスポンス形状。

コンテキスト最適化

Router は冗長な履歴を削り、過去の記憶を検索し、関連するコンテキストだけをプロンプトに注入します。

転送

強化されたリクエストはモデルへ — 自分のプロバイダー（BYOK）または MemoryLake ホストのモデルへ。生の再送よりも入力トークンが少なくなります。

記憶

新しい記憶はバックグラウンドで非同期に抽出・保存される — レスポンスが遅延することはありません。

二つの接続方法

BYOK か MemoryLake ホストか — あなた次第

自分のキー持ち込みを強制するプロキシと違い、Memory Router は両方に対応します。どちらも変更は base URL だけ。他のすべて — プロンプト、ストリーミング、ツール呼び出し — はそのままです。

BYOK

自分のキーを持ち込む

自分のプロバイダーアカウントを使用。あなたのキーは転送中に暗号化され、呼び出しごとにプロバイダーへ転送され、当社のサーバーには一切保存されません。

既存の OpenAI / Anthropic / Google アカウントをそのまま使用。
あなたのキー、あなたの課金、あなたのレート制限。
キーは暗号化＋透過のみ — 保存もログ記録もされません。

必要なキー：プロバイダーキー + MemoryLake キー

キー不要

MemoryLake ホスト

プロバイダーアカウントは不要。MemoryLake が主要モデルを代わりに動かすので、MemoryLake API キー一つだけで始められます。

すべてをキー一つで — 他に登録するものはありません。
主要モデルが組み込み済みで、すぐ呼び出せます。
記憶付きで出荷する最もシンプルな方法。

必要なキー：MemoryLake キーのみ

キーの安全性は設計から：BYOK モードでは、プロバイダーキーは転送中に暗号化され、毎回そのままプロバイダーへ渡されます。MemoryLake が保存・ログ記録・再利用することは一切ありません。

BYOK — あなたのプロバイダーキー

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://router.memorylake.ai/v1/openai",
  apiKey: process.env.OPENAI_API_KEY,        // your provider key
  defaultHeaders: {
    // encrypted in transit · passthrough only · never stored
    "x-memorylake-api-key": process.env.MEMORYLAKE_API_KEY,
  },
});

MemoryLake ホスト — キー一つ

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://router.memorylake.ai/v1",
  apiKey: process.env.MEMORYLAKE_API_KEY,    // one key — that's it
});

// Pick any built-in model, e.g. "claude-opus-4-8" or "gpt-5".

得られるもの

構築せずに手に入る記憶インフラ

一行で統合

base URL を変えるだけ。SDK もコードもそのまま。

BYOK またはホスト

自分のプロバイダーキーを持ち込む（暗号化・非保存）か、MemoryLake ホストのモデルをキー一つで使う。

自動コンテキスト最適化

冗長な履歴を除去し、関連する記憶だけを注入して、呼び出しごとのトークンを削減。

共有記憶プール

Router と MemoryLake API は同じ記憶を読み書きする — 唯一の真実の源。

グレースフルなフォールバック

MemoryLake が利用できないときは、リクエストはそのままプロバイダーへ透過。ダウンタイムゼロ。

完全な可観測性

レスポンスヘッダーが会話 ID、コンテキスト変更、トークン数、作成・取得された記憶を報告します。

互換性

既にお使いのプロバイダーで動作

BYOK モードではプロバイダーのアカウントとキーをそのまま使用。ホストモードでは MemoryLake がこれらのモデルを代わりに動かします — どちらも同じ記憶層です。

プロバイダー	ステータス
OpenAI / GPT	完全対応
Anthropic / Claude	完全対応
Google Gemini	完全対応
Groq、DeepSeek、OpenRouter	完全対応
任意の OpenAI 互換エンドポイント	対応
OpenAI Assistants API	未対応

透明性

すべてのレスポンスが何が起きたかを教える

Memory Router は診断ヘッダーを返すので、各リクエストがどう処理されたかを正確に確認できます — ブラックボックスではありません。

会話 ID

リクエストが帰属したスレッド。ターンをグループ化して検証できます。

コンテキスト変更

この呼び出しで記憶が注入されたか、履歴が削られたか。

トークン数

最適化後に送信したトークン数と、生の再送との比較。

触れた記憶

取得した記憶チャンク数と、新規作成した数。

セットアップ

三ステップで稼働

1
MemoryLake キーを取得
MemoryLake にサインアップして API キーを作成。Free プランには開始用の記憶ストレージが含まれます。
2
モードを選んで base URL を差し替え
SDK を Router エンドポイントに向けます。BYOK ならプロバイダーキーを残し、MemoryLake キーをヘッダーに追加。ホストなら MemoryLake キーだけでOK。
3
普通に呼び出す
今日と同じようにリクエストを送るだけ。記憶は自動で取得・保存され、レスポンスヘッダーで確認できます。

違い

API 直結 vs. Memory Router

会話が長くなるにつれ、呼び出しごとに送信するトークン

トークン約 90% 削減

直接呼び出し毎ターン履歴全体

Memory Router関連する記憶だけ

	プロバイダー直結	Memory Router 使用
長期記憶	自分で構築・ホスト	組み込み・自動
コンテキストウィンドウ	全部再送して切り捨て	最適化 — 重要なものだけ
キーとアカウント	プロバイダーアカウントが必須	BYOK または MemoryLake キー一つだけ
コード変更	新 SDK + 検索パイプライン	base URL を一つ変更
セッション・モデルをまたいで	アプリごとに記憶が孤立	共有記憶プール
記憶層プロバイダーの障害	自分で対処	グレースフルな透過
可視性	デフォルトでなし	診断レスポンスヘッダー

よくある質問

コードを変更する必要がありますか？

base URL と一つのヘッダーだけです。プロンプト、ストリーミング、ツール呼び出し、レスポンス処理は同一のまま — Memory Router はプロバイダーと同じ API を話します。

どのプロバイダーに対応していますか？

OpenAI、Anthropic、Google Gemini、Groq、DeepSeek、OpenRouter、および任意の OpenAI 互換エンドポイント。OpenAI Assistants API は未対応です。

BYOK と MemoryLake ホストの違いは？

BYOK（自分のキー持ち込み）は、自分のプロバイダーキーと MemoryLake キーを指定する方式で、課金とレート制限はプロバイダーアカウントに残ります。ホストは MemoryLake キーだけでOK：主要モデルを当社が動かすため、プロバイダー登録は不要です。

BYOK モードでプロバイダーキーは安全ですか？

はい。プロバイダーキーは転送中に暗号化され、呼び出しごとにプロバイダーへ転送されます。MemoryLake が保存・ログ記録・再利用することは一切なく、透過するだけです。

MemoryLake がダウンしたらどうなりますか？

BYOK モードでは Memory Router はフェイルオープン：リクエストはそのままプロバイダーへ透過し、アプリはダウンタイムゼロで動き続けます。

どうやってトークンを削減しますか？

毎ターン履歴全体を再送する代わりに、Router は冗長なコンテキストを除去し、関連する記憶だけを注入します — 会話が長くなるほど呼び出しごとのトークンが少なくなります。

記憶は MemoryLake API と共有されますか？

はい。Router と MemoryLake API は同じ記憶プール上で動作するため、一方で保存したものはもう一方で取得できます。

無料プランはありますか？

はい。Memory Router は Free プランで利用できるので、スケールする前に統合・テストできます。

すべての LLM に記憶を — URL を一つ変えるだけ。

コンテキストの再送と検索の再構築をやめましょう。SDK を Memory Router に向けて、今日から記憶を届けましょう。

Router キーを取得ドキュメントを読む →

URL を一つ変えるだけで、あらゆる LLM に永続的な記憶を

ステートレスな API は毎回記憶を作り直させる

記憶層がない場合

自分で構築する場合

四ステップの透過的プロキシ

インターセプト

コンテキスト最適化

転送

記憶

BYOK か MemoryLake ホストか — あなた次第

自分のキーを持ち込む

MemoryLake ホスト

構築せずに手に入る記憶インフラ

一行で統合

BYOK またはホスト

自動コンテキスト最適化

共有記憶プール

グレースフルなフォールバック

完全な可観測性

既にお使いのプロバイダーで動作

すべてのレスポンスが何が起きたかを教える

会話 ID

コンテキスト変更

トークン数

触れた記憶

三ステップで稼働

MemoryLake キーを取得

モードを選んで base URL を差し替え

普通に呼び出す

API 直結 vs. Memory Router

会話が長くなるにつれ、呼び出しごとに送信するトークン

よくある質問

すべての LLM に記憶を — URL を一つ変えるだけ。