Añade memoria persistente a cualquier LLM con un solo cambio de URL
Memory Router es un proxy transparente que se sitúa entre tu aplicación y el modelo. Apunta tu SDK actual a MemoryLake y cada conversación gana memoria a largo plazo y una ventana de contexto optimizada. Úsalo de dos formas: trae tu propia clave de proveedor (BYOK), o usa modelos alojados por MemoryLake con una sola clave de MemoryLake.
Las APIs sin estado te obligan a reconstruir la memoria cada vez
Cada llamada a un LLM es sin estado. Para simular continuidad reenvías todo el historial en cada turno — lento, caro y al final desbordas la ventana de contexto. Añadir una base de datos vectorial y una tubería de recuperación lo resuelve, pero son semanas de fontanería que tienes que construir y mantener.
Sin una capa de memoria
- Todo el historial se reenvía en cada llamada — el costo en tokens sube con la longitud de la conversación.
- Las sesiones largas chocan con el techo de la ventana de contexto y empiezan a truncar a mitad de tarea.
- La memoria vive en una sola app — cambia de modelo o de sesión y el contexto desaparece.
Construirlo tú mismo
- Levantar una base de datos vectorial, una tubería de embeddings, chunking y lógica de recuperación.
- Escribir extracción, deduplicación y ranking de relevancia — y luego mantenerlo afinado.
- Mantenerlo en cada proveedor y cada modelo que soportes.
Memory Router reduce todo eso a un solo cambio de base URL. El proxy es la capa de memoria.
Un proxy transparente en cuatro pasos
Si MemoryLake no está disponible, las solicitudes pasan directas a tu proveedor — cero tiempo de inactividad.
Intercepta
Tu app envía la solicitud a Memory Router en lugar del proveedor — mismo payload, mismo SDK, misma forma de respuesta.
Optimiza el contexto
El Router recorta el historial redundante, busca memorias previas e inyecta solo el contexto relevante en el prompt.
Reenvía
La solicitud mejorada va al modelo — tu propio proveedor (BYOK) o un modelo alojado por MemoryLake. Entran menos tokens que en una repetición en bruto.
Recuerda
Las nuevas memorias se extraen y almacenan de forma asíncrona en segundo plano — la respuesta nunca se retrasa.
BYOK o alojado por MemoryLake — tú decides
A diferencia de los proxies que te obligan a traer tu clave, Memory Router funciona de las dos formas. En ambos casos el cambio es solo la base URL; todo lo demás — prompts, streaming, tool calls — queda igual.
Trae tu propia clave
Usa tu propia cuenta de proveedor. Tu clave se cifra en tránsito, se reenvía al proveedor en cada llamada y nunca se almacena en nuestros servidores.
- Conserva tu cuenta de OpenAI / Anthropic / Google.
- Tu clave, tu facturación, tus límites de uso.
- La clave es cifrada y de solo paso — nunca se persiste ni se registra.
Alojado por MemoryLake
No necesitas cuenta de proveedor. MemoryLake ejecuta los modelos principales por ti, así que una sola clave de MemoryLake basta para empezar.
- Una clave para todo — nada más que registrar.
- Modelos principales integrados y listos para llamar.
- La forma más simple de lanzar con memoria.
Seguridad de la clave, por diseño: en modo BYOK tu clave de proveedor se cifra en tránsito y pasa directa al proveedor en cada llamada. MemoryLake nunca la almacena, registra ni reutiliza.
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://router.memorylake.ai/v1/openai",
apiKey: process.env.OPENAI_API_KEY, // your provider key
defaultHeaders: {
// encrypted in transit · passthrough only · never stored
"x-memorylake-api-key": process.env.MEMORYLAKE_API_KEY,
},
});import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://router.memorylake.ai/v1",
apiKey: process.env.MEMORYLAKE_API_KEY, // one key — that's it
});
// Pick any built-in model, e.g. "claude-opus-4-8" or "gpt-5".Infraestructura de memoria sin construirla
Integración de una línea
Cambia la base URL. Conserva tu SDK y tu código tal cual.
BYOK o alojado
Trae tu clave de proveedor (cifrada, nunca almacenada) o usa modelos alojados por MemoryLake con una sola clave.
Optimización automática del contexto
Se elimina el historial redundante y solo se inyecta la memoria relevante, reduciendo tokens por llamada.
Pool de memoria compartido
El Router y la API de MemoryLake leen y escriben las mismas memorias — una única fuente de verdad.
Degradación elegante
Si MemoryLake no está disponible, la solicitud pasa directa a tu proveedor. Cero tiempo de inactividad.
Observabilidad total
Las cabeceras de respuesta reportan IDs de conversación, cambios de contexto, conteo de tokens y memorias creadas o recuperadas.
Funciona con los proveedores que ya usas
En modo BYOK, conserva tu cuenta y clave de proveedor. En modo alojado, MemoryLake ejecuta estos modelos por ti — la misma capa de memoria en ambos casos.
| Proveedor | Estado |
|---|---|
| OpenAI / GPT | Totalmente compatible |
| Anthropic / Claude | Totalmente compatible |
| Google Gemini | Totalmente compatible |
| Groq, DeepSeek, OpenRouter | Totalmente compatible |
| Cualquier endpoint compatible con OpenAI | Compatible |
| OpenAI Assistants API | Aún no compatible |
Cada respuesta te dice qué pasó
Memory Router devuelve cabeceras de diagnóstico para que veas exactamente cómo se gestionó cada solicitud — sin caja negra.
ID de conversación
El hilo al que se atribuyó la solicitud, para agrupar e inspeccionar los turnos.
Contexto modificado
Si se inyectó memoria o se recortó el historial en esta llamada.
Conteo de tokens
Cuántos tokens se enviaron tras la optimización frente a una repetición en bruto.
Memorias tocadas
Cuántos fragmentos de memoria se recuperaron y cuántos se crearon.
En producción en tres pasos
- 1
Obtén una clave de MemoryLake
Regístrate en MemoryLake y crea una API key. El plan Free incluye almacenamiento de memoria para empezar.
- 2
Elige modo + cambia la base URL
Apunta tu SDK al endpoint del Router. Para BYOK, conserva tu clave de proveedor y añade la clave de MemoryLake como cabecera. Para alojado, usa solo tu clave de MemoryLake.
- 3
Llama como siempre
Envía las solicitudes igual que hoy. La memoria se recupera y almacena automáticamente; lee las cabeceras de respuesta para confirmarlo.
Llamada directa a la API vs. Memory Router
Tokens enviados por llamada, conforme crece la conversación
≈ 90% menos tokens| Llamada directa al proveedor | Con Memory Router | |
|---|---|---|
| Memoria a largo plazo | La construyes y la alojas tú | Integrada, automática |
| Ventana de contexto | Reenviar todo y luego truncar | Optimizada — solo lo que importa |
| Claves y cuentas | Requiere una cuenta de proveedor | BYOK o solo una clave de MemoryLake |
| Cambios de código | Nuevo SDK + tubería de recuperación | Un cambio de base URL |
| Entre sesiones y modelos | Memoria aislada por app | Pool de memoria compartido |
| Caída de la capa de memoria | Tu problema a resolver | Passthrough elegante |
| Visibilidad | Ninguna por defecto | Cabeceras de respuesta de diagnóstico |
Preguntas frecuentes
¿Necesito cambiar mi código?
Solo la base URL y una cabecera. Tus prompts, streaming, tool calls y manejo de respuestas quedan idénticos — Memory Router habla la misma API que tu proveedor.
¿Qué proveedores son compatibles?
OpenAI, Anthropic, Google Gemini, Groq, DeepSeek, OpenRouter y cualquier endpoint compatible con OpenAI. La OpenAI Assistants API aún no es compatible.
¿Cuál es la diferencia entre BYOK y alojado por MemoryLake?
BYOK (trae tu propia clave) significa que aportas tu clave de proveedor más una clave de MemoryLake — la facturación y los límites siguen en tu cuenta del proveedor. El modo alojado solo necesita una clave de MemoryLake: ejecutamos los modelos principales por ti, así que te saltas el registro con el proveedor.
En modo BYOK, ¿está segura mi clave de proveedor?
Sí. Tu clave se cifra en tránsito y se reenvía al proveedor en cada llamada. MemoryLake nunca la almacena, registra ni reutiliza — es solo de paso.
¿Qué pasa si MemoryLake está caído?
En modo BYOK, Memory Router falla en abierto: la solicitud pasa directa a tu proveedor para que tu aplicación siga funcionando con cero tiempo de inactividad.
¿Cómo reduce los tokens?
En lugar de repetir todo el historial en cada turno, el Router elimina el contexto redundante e inyecta solo las memorias relevantes — menos tokens por llamada a medida que la conversación crece.
¿La memoria se comparte con la API de MemoryLake?
Sí. El Router y la API de MemoryLake operan sobre el mismo pool de memoria, así que lo que guardas por un lado se recupera por el otro.
¿Hay un plan gratuito?
Sí. Memory Router está disponible en el plan Free para que integres y pruebes antes de escalar.
Dale memoria a cada LLM — cambia una URL.
Deja de reenviar contexto y de reconstruir la recuperación. Apunta tu SDK a Memory Router y entrega memoria hoy.