MemoryLake
Memory Router · Proxy de memoria plug-and-play para cualquier LLM

Añade memoria persistente a cualquier LLM con un solo cambio de URL

Memory Router es un proxy transparente que se sitúa entre tu aplicación y el modelo. Apunta tu SDK actual a MemoryLake y cada conversación gana memoria a largo plazo y una ventana de contexto optimizada. Úsalo de dos formas: trae tu propia clave de proveedor (BYOK), o usa modelos alojados por MemoryLake con una sola clave de MemoryLake.

Obtén tu clave de RouterLeer la documentación →Funciona con los SDK de OpenAI, Anthropic y Google que ya usas
El problema

Las APIs sin estado te obligan a reconstruir la memoria cada vez

Cada llamada a un LLM es sin estado. Para simular continuidad reenvías todo el historial en cada turno — lento, caro y al final desbordas la ventana de contexto. Añadir una base de datos vectorial y una tubería de recuperación lo resuelve, pero son semanas de fontanería que tienes que construir y mantener.

Sin una capa de memoria

  • Todo el historial se reenvía en cada llamada — el costo en tokens sube con la longitud de la conversación.
  • Las sesiones largas chocan con el techo de la ventana de contexto y empiezan a truncar a mitad de tarea.
  • La memoria vive en una sola app — cambia de modelo o de sesión y el contexto desaparece.

Construirlo tú mismo

  • Levantar una base de datos vectorial, una tubería de embeddings, chunking y lógica de recuperación.
  • Escribir extracción, deduplicación y ranking de relevancia — y luego mantenerlo afinado.
  • Mantenerlo en cada proveedor y cada modelo que soportes.

Memory Router reduce todo eso a un solo cambio de base URL. El proxy es la capa de memoria.

Cómo funciona

Un proxy transparente en cuatro pasos

Tu aplicación
SDK de OpenAI / Anthropic / Google
solicitud
Memory Router
Proxy transparente
Recorta historial redundanteInyecta memoria relevante
solicitud mejorada
Modelo
BYOK o alojado
Tu proveedor · BYOKAlojado en MemoryLake
Almacén de memoria· lectura/escritura asíncrona

Si MemoryLake no está disponible, las solicitudes pasan directas a tu proveedor — cero tiempo de inactividad.

1

Intercepta

Tu app envía la solicitud a Memory Router en lugar del proveedor — mismo payload, mismo SDK, misma forma de respuesta.

2

Optimiza el contexto

El Router recorta el historial redundante, busca memorias previas e inyecta solo el contexto relevante en el prompt.

3

Reenvía

La solicitud mejorada va al modelo — tu propio proveedor (BYOK) o un modelo alojado por MemoryLake. Entran menos tokens que en una repetición en bruto.

4

Recuerda

Las nuevas memorias se extraen y almacenan de forma asíncrona en segundo plano — la respuesta nunca se retrasa.

Dos formas de conectar

BYOK o alojado por MemoryLake — tú decides

A diferencia de los proxies que te obligan a traer tu clave, Memory Router funciona de las dos formas. En ambos casos el cambio es solo la base URL; todo lo demás — prompts, streaming, tool calls — queda igual.

BYOK

Trae tu propia clave

Usa tu propia cuenta de proveedor. Tu clave se cifra en tránsito, se reenvía al proveedor en cada llamada y nunca se almacena en nuestros servidores.

  • Conserva tu cuenta de OpenAI / Anthropic / Google.
  • Tu clave, tu facturación, tus límites de uso.
  • La clave es cifrada y de solo paso — nunca se persiste ni se registra.
Claves: tu clave de proveedor + clave de MemoryLake
Sin clave

Alojado por MemoryLake

No necesitas cuenta de proveedor. MemoryLake ejecuta los modelos principales por ti, así que una sola clave de MemoryLake basta para empezar.

  • Una clave para todo — nada más que registrar.
  • Modelos principales integrados y listos para llamar.
  • La forma más simple de lanzar con memoria.
Claves: solo la clave de MemoryLake

Seguridad de la clave, por diseño: en modo BYOK tu clave de proveedor se cifra en tránsito y pasa directa al proveedor en cada llamada. MemoryLake nunca la almacena, registra ni reutiliza.

BYOK — tu clave de proveedor
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://router.memorylake.ai/v1/openai",
  apiKey: process.env.OPENAI_API_KEY,        // your provider key
  defaultHeaders: {
    // encrypted in transit · passthrough only · never stored
    "x-memorylake-api-key": process.env.MEMORYLAKE_API_KEY,
  },
});
Alojado por MemoryLake — una clave
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://router.memorylake.ai/v1",
  apiKey: process.env.MEMORYLAKE_API_KEY,    // one key — that's it
});

// Pick any built-in model, e.g. "claude-opus-4-8" or "gpt-5".
Qué obtienes

Infraestructura de memoria sin construirla

Integración de una línea

Cambia la base URL. Conserva tu SDK y tu código tal cual.

BYOK o alojado

Trae tu clave de proveedor (cifrada, nunca almacenada) o usa modelos alojados por MemoryLake con una sola clave.

Optimización automática del contexto

Se elimina el historial redundante y solo se inyecta la memoria relevante, reduciendo tokens por llamada.

Pool de memoria compartido

El Router y la API de MemoryLake leen y escriben las mismas memorias — una única fuente de verdad.

Degradación elegante

Si MemoryLake no está disponible, la solicitud pasa directa a tu proveedor. Cero tiempo de inactividad.

Observabilidad total

Las cabeceras de respuesta reportan IDs de conversación, cambios de contexto, conteo de tokens y memorias creadas o recuperadas.

Compatibilidad

Funciona con los proveedores que ya usas

En modo BYOK, conserva tu cuenta y clave de proveedor. En modo alojado, MemoryLake ejecuta estos modelos por ti — la misma capa de memoria en ambos casos.

ProveedorEstado
OpenAI / GPTTotalmente compatible
Anthropic / ClaudeTotalmente compatible
Google GeminiTotalmente compatible
Groq, DeepSeek, OpenRouterTotalmente compatible
Cualquier endpoint compatible con OpenAICompatible
OpenAI Assistants APIAún no compatible
Transparencia

Cada respuesta te dice qué pasó

Memory Router devuelve cabeceras de diagnóstico para que veas exactamente cómo se gestionó cada solicitud — sin caja negra.

ID de conversación

El hilo al que se atribuyó la solicitud, para agrupar e inspeccionar los turnos.

Contexto modificado

Si se inyectó memoria o se recortó el historial en esta llamada.

Conteo de tokens

Cuántos tokens se enviaron tras la optimización frente a una repetición en bruto.

Memorias tocadas

Cuántos fragmentos de memoria se recuperaron y cuántos se crearon.

Configuración

En producción en tres pasos

  1. 1

    Obtén una clave de MemoryLake

    Regístrate en MemoryLake y crea una API key. El plan Free incluye almacenamiento de memoria para empezar.

  2. 2

    Elige modo + cambia la base URL

    Apunta tu SDK al endpoint del Router. Para BYOK, conserva tu clave de proveedor y añade la clave de MemoryLake como cabecera. Para alojado, usa solo tu clave de MemoryLake.

  3. 3

    Llama como siempre

    Envía las solicitudes igual que hoy. La memoria se recupera y almacena automáticamente; lee las cabeceras de respuesta para confirmarlo.

La diferencia

Llamada directa a la API vs. Memory Router

Tokens enviados por llamada, conforme crece la conversación

≈ 90% menos tokens
Llamada directahistorial completo, cada turno
Memory Routersolo memoria relevante
Llamada directa al proveedorCon Memory Router
Memoria a largo plazoLa construyes y la alojas túIntegrada, automática
Ventana de contextoReenviar todo y luego truncarOptimizada — solo lo que importa
Claves y cuentasRequiere una cuenta de proveedorBYOK o solo una clave de MemoryLake
Cambios de códigoNuevo SDK + tubería de recuperaciónUn cambio de base URL
Entre sesiones y modelosMemoria aislada por appPool de memoria compartido
Caída de la capa de memoriaTu problema a resolverPassthrough elegante
VisibilidadNinguna por defectoCabeceras de respuesta de diagnóstico

Preguntas frecuentes

¿Necesito cambiar mi código?

Solo la base URL y una cabecera. Tus prompts, streaming, tool calls y manejo de respuestas quedan idénticos — Memory Router habla la misma API que tu proveedor.

¿Qué proveedores son compatibles?

OpenAI, Anthropic, Google Gemini, Groq, DeepSeek, OpenRouter y cualquier endpoint compatible con OpenAI. La OpenAI Assistants API aún no es compatible.

¿Cuál es la diferencia entre BYOK y alojado por MemoryLake?

BYOK (trae tu propia clave) significa que aportas tu clave de proveedor más una clave de MemoryLake — la facturación y los límites siguen en tu cuenta del proveedor. El modo alojado solo necesita una clave de MemoryLake: ejecutamos los modelos principales por ti, así que te saltas el registro con el proveedor.

En modo BYOK, ¿está segura mi clave de proveedor?

Sí. Tu clave se cifra en tránsito y se reenvía al proveedor en cada llamada. MemoryLake nunca la almacena, registra ni reutiliza — es solo de paso.

¿Qué pasa si MemoryLake está caído?

En modo BYOK, Memory Router falla en abierto: la solicitud pasa directa a tu proveedor para que tu aplicación siga funcionando con cero tiempo de inactividad.

¿Cómo reduce los tokens?

En lugar de repetir todo el historial en cada turno, el Router elimina el contexto redundante e inyecta solo las memorias relevantes — menos tokens por llamada a medida que la conversación crece.

¿La memoria se comparte con la API de MemoryLake?

Sí. El Router y la API de MemoryLake operan sobre el mismo pool de memoria, así que lo que guardas por un lado se recupera por el otro.

¿Hay un plan gratuito?

Sí. Memory Router está disponible en el plan Free para que integres y pruebes antes de escalar.

Dale memoria a cada LLM — cambia una URL.

Deja de reenviar contexto y de reconstruir la recuperación. Apunta tu SDK a Memory Router y entrega memoria hoy.