Do I need to change my code?

Only the base URL and one header. Your prompts, streaming, tool calls, and response handling stay identical — Memory Router speaks the same API as your provider.

Which providers are supported?

OpenAI, Anthropic, Google Gemini, Groq, DeepSeek, OpenRouter, and any OpenAI-compatible endpoint. The OpenAI Assistants API is not yet supported.

What is the difference between BYOK and MemoryLake-hosted?

BYOK (Bring Your Own Key) means you supply your own provider key plus a MemoryLake key — billing and rate limits stay with your provider account. MemoryLake-hosted needs only a MemoryLake key: we run the major models for you, so you skip provider sign-up entirely.

In BYOK mode, is my provider key safe?

Yes. Your provider key is encrypted in transit and forwarded to the provider on each call. MemoryLake never stores, logs, or reuses it — it is passthrough only.

What happens if MemoryLake is down?

In BYOK mode Memory Router fails open: the request passes straight through to your provider so your application keeps working with zero downtime.

How does it reduce tokens?

Instead of replaying the entire history each turn, the Router removes redundant context and injects only the relevant memories — fewer tokens per call as conversations grow.

Is there a free plan?

Yes. Memory Router is available on the Free tier so you can integrate and test before scaling up.

Memory Router · Proxy de memoria plug-and-play para cualquier LLM

Añade memoria persistente a cualquier LLM con un solo cambio de URL

Memory Router es un proxy transparente que se sitúa entre tu aplicación y el modelo. Apunta tu SDK actual a MemoryLake y cada conversación gana memoria a largo plazo y una ventana de contexto optimizada. Úsalo de dos formas: trae tu propia clave de proveedor (BYOK), o usa modelos alojados por MemoryLake con una sola clave de MemoryLake.

Obtén tu clave de Router Leer la documentación →Funciona con los SDK de OpenAI, Anthropic y Google que ya usas

El problema

Las APIs sin estado te obligan a reconstruir la memoria cada vez

Cada llamada a un LLM es sin estado. Para simular continuidad reenvías todo el historial en cada turno — lento, caro y al final desbordas la ventana de contexto. Añadir una base de datos vectorial y una tubería de recuperación lo resuelve, pero son semanas de fontanería que tienes que construir y mantener.

Sin una capa de memoria

Todo el historial se reenvía en cada llamada — el costo en tokens sube con la longitud de la conversación.
Las sesiones largas chocan con el techo de la ventana de contexto y empiezan a truncar a mitad de tarea.
La memoria vive en una sola app — cambia de modelo o de sesión y el contexto desaparece.

Construirlo tú mismo

Levantar una base de datos vectorial, una tubería de embeddings, chunking y lógica de recuperación.
Escribir extracción, deduplicación y ranking de relevancia — y luego mantenerlo afinado.
Mantenerlo en cada proveedor y cada modelo que soportes.

Memory Router reduce todo eso a un solo cambio de base URL. El proxy es la capa de memoria.

Cómo funciona

Un proxy transparente en cuatro pasos

Tu aplicación

SDK de OpenAI / Anthropic / Google

solicitud

Memory Router

Proxy transparente

Recorta historial redundanteInyecta memoria relevante

solicitud mejorada

Modelo

BYOK o alojado

Tu proveedor · BYOKAlojado en MemoryLake

Almacén de memoria· lectura/escritura asíncrona

Si MemoryLake no está disponible, las solicitudes pasan directas a tu proveedor — cero tiempo de inactividad.

Intercepta

Tu app envía la solicitud a Memory Router en lugar del proveedor — mismo payload, mismo SDK, misma forma de respuesta.

Optimiza el contexto

El Router recorta el historial redundante, busca memorias previas e inyecta solo el contexto relevante en el prompt.

Reenvía

La solicitud mejorada va al modelo — tu propio proveedor (BYOK) o un modelo alojado por MemoryLake. Entran menos tokens que en una repetición en bruto.

Recuerda

Las nuevas memorias se extraen y almacenan de forma asíncrona en segundo plano — la respuesta nunca se retrasa.

Dos formas de conectar

BYOK o alojado por MemoryLake — tú decides

A diferencia de los proxies que te obligan a traer tu clave, Memory Router funciona de las dos formas. En ambos casos el cambio es solo la base URL; todo lo demás — prompts, streaming, tool calls — queda igual.

BYOK

Trae tu propia clave

Usa tu propia cuenta de proveedor. Tu clave se cifra en tránsito, se reenvía al proveedor en cada llamada y nunca se almacena en nuestros servidores.

Conserva tu cuenta de OpenAI / Anthropic / Google.
Tu clave, tu facturación, tus límites de uso.
La clave es cifrada y de solo paso — nunca se persiste ni se registra.

Claves: tu clave de proveedor + clave de MemoryLake

Sin clave

Alojado por MemoryLake

No necesitas cuenta de proveedor. MemoryLake ejecuta los modelos principales por ti, así que una sola clave de MemoryLake basta para empezar.

Una clave para todo — nada más que registrar.
Modelos principales integrados y listos para llamar.
La forma más simple de lanzar con memoria.

Claves: solo la clave de MemoryLake

Seguridad de la clave, por diseño: en modo BYOK tu clave de proveedor se cifra en tránsito y pasa directa al proveedor en cada llamada. MemoryLake nunca la almacena, registra ni reutiliza.

BYOK — tu clave de proveedor

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://router.memorylake.ai/v1/openai",
  apiKey: process.env.OPENAI_API_KEY,        // your provider key
  defaultHeaders: {
    // encrypted in transit · passthrough only · never stored
    "x-memorylake-api-key": process.env.MEMORYLAKE_API_KEY,
  },
});

Alojado por MemoryLake — una clave

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://router.memorylake.ai/v1",
  apiKey: process.env.MEMORYLAKE_API_KEY,    // one key — that's it
});

// Pick any built-in model, e.g. "claude-opus-4-8" or "gpt-5".

Qué obtienes

Infraestructura de memoria sin construirla

Integración de una línea

Cambia la base URL. Conserva tu SDK y tu código tal cual.

BYOK o alojado

Trae tu clave de proveedor (cifrada, nunca almacenada) o usa modelos alojados por MemoryLake con una sola clave.

Optimización automática del contexto

Se elimina el historial redundante y solo se inyecta la memoria relevante, reduciendo tokens por llamada.

Pool de memoria compartido

El Router y la API de MemoryLake leen y escriben las mismas memorias — una única fuente de verdad.

Degradación elegante

Si MemoryLake no está disponible, la solicitud pasa directa a tu proveedor. Cero tiempo de inactividad.

Observabilidad total

Las cabeceras de respuesta reportan IDs de conversación, cambios de contexto, conteo de tokens y memorias creadas o recuperadas.

Compatibilidad

Funciona con los proveedores que ya usas

En modo BYOK, conserva tu cuenta y clave de proveedor. En modo alojado, MemoryLake ejecuta estos modelos por ti — la misma capa de memoria en ambos casos.

Proveedor	Estado
OpenAI / GPT	Totalmente compatible
Anthropic / Claude	Totalmente compatible
Google Gemini	Totalmente compatible
Groq, DeepSeek, OpenRouter	Totalmente compatible
Cualquier endpoint compatible con OpenAI	Compatible
OpenAI Assistants API	Aún no compatible

Transparencia

Cada respuesta te dice qué pasó

Memory Router devuelve cabeceras de diagnóstico para que veas exactamente cómo se gestionó cada solicitud — sin caja negra.

ID de conversación

El hilo al que se atribuyó la solicitud, para agrupar e inspeccionar los turnos.

Contexto modificado

Si se inyectó memoria o se recortó el historial en esta llamada.

Conteo de tokens

Cuántos tokens se enviaron tras la optimización frente a una repetición en bruto.

Memorias tocadas

Cuántos fragmentos de memoria se recuperaron y cuántos se crearon.

Configuración

En producción en tres pasos

1
Obtén una clave de MemoryLake
Regístrate en MemoryLake y crea una API key. El plan Free incluye almacenamiento de memoria para empezar.
2
Elige modo + cambia la base URL
Apunta tu SDK al endpoint del Router. Para BYOK, conserva tu clave de proveedor y añade la clave de MemoryLake como cabecera. Para alojado, usa solo tu clave de MemoryLake.
3
Llama como siempre
Envía las solicitudes igual que hoy. La memoria se recupera y almacena automáticamente; lee las cabeceras de respuesta para confirmarlo.

La diferencia

Llamada directa a la API vs. Memory Router

Tokens enviados por llamada, conforme crece la conversación

≈ 90% menos tokens

Llamada directahistorial completo, cada turno

Memory Routersolo memoria relevante

	Llamada directa al proveedor	Con Memory Router
Memoria a largo plazo	La construyes y la alojas tú	Integrada, automática
Ventana de contexto	Reenviar todo y luego truncar	Optimizada — solo lo que importa
Claves y cuentas	Requiere una cuenta de proveedor	BYOK o solo una clave de MemoryLake
Cambios de código	Nuevo SDK + tubería de recuperación	Un cambio de base URL
Entre sesiones y modelos	Memoria aislada por app	Pool de memoria compartido
Caída de la capa de memoria	Tu problema a resolver	Passthrough elegante
Visibilidad	Ninguna por defecto	Cabeceras de respuesta de diagnóstico

Preguntas frecuentes

¿Necesito cambiar mi código?

Solo la base URL y una cabecera. Tus prompts, streaming, tool calls y manejo de respuestas quedan idénticos — Memory Router habla la misma API que tu proveedor.

¿Qué proveedores son compatibles?

OpenAI, Anthropic, Google Gemini, Groq, DeepSeek, OpenRouter y cualquier endpoint compatible con OpenAI. La OpenAI Assistants API aún no es compatible.

¿Cuál es la diferencia entre BYOK y alojado por MemoryLake?

BYOK (trae tu propia clave) significa que aportas tu clave de proveedor más una clave de MemoryLake — la facturación y los límites siguen en tu cuenta del proveedor. El modo alojado solo necesita una clave de MemoryLake: ejecutamos los modelos principales por ti, así que te saltas el registro con el proveedor.

En modo BYOK, ¿está segura mi clave de proveedor?

Sí. Tu clave se cifra en tránsito y se reenvía al proveedor en cada llamada. MemoryLake nunca la almacena, registra ni reutiliza — es solo de paso.

¿Qué pasa si MemoryLake está caído?

En modo BYOK, Memory Router falla en abierto: la solicitud pasa directa a tu proveedor para que tu aplicación siga funcionando con cero tiempo de inactividad.

¿Cómo reduce los tokens?

En lugar de repetir todo el historial en cada turno, el Router elimina el contexto redundante e inyecta solo las memorias relevantes — menos tokens por llamada a medida que la conversación crece.

¿La memoria se comparte con la API de MemoryLake?

Sí. El Router y la API de MemoryLake operan sobre el mismo pool de memoria, así que lo que guardas por un lado se recupera por el otro.

¿Hay un plan gratuito?

Sí. Memory Router está disponible en el plan Free para que integres y pruebes antes de escalar.

Dale memoria a cada LLM — cambia una URL.

Deja de reenviar contexto y de reconstruir la recuperación. Apunta tu SDK a Memory Router y entrega memoria hoy.

Obtén tu clave de Router Leer la documentación →

Añade memoria persistente a cualquier LLM con un solo cambio de URL

Las APIs sin estado te obligan a reconstruir la memoria cada vez

Sin una capa de memoria

Construirlo tú mismo

Un proxy transparente en cuatro pasos

Intercepta

Optimiza el contexto

Reenvía

Recuerda

BYOK o alojado por MemoryLake — tú decides

Trae tu propia clave

Alojado por MemoryLake

Infraestructura de memoria sin construirla

Integración de una línea

BYOK o alojado

Optimización automática del contexto

Pool de memoria compartido

Degradación elegante

Observabilidad total

Funciona con los proveedores que ya usas

Cada respuesta te dice qué pasó

ID de conversación

Contexto modificado

Conteo de tokens

Memorias tocadas

En producción en tres pasos

Obtén una clave de MemoryLake

Elige modo + cambia la base URL

Llama como siempre

Llamada directa a la API vs. Memory Router

Tokens enviados por llamada, conforme crece la conversación

Preguntas frecuentes

Dale memoria a cada LLM — cambia una URL.