URL 하나만 바꿔 모든 LLM에 영구 메모리를 더하세요
Memory Router는 앱과 모델 사이에 위치하는 투명 프록시입니다. 기존 SDK를 MemoryLake로 향하게 하면 모든 대화가 장기 메모리와 최적화된 컨텍스트 윈도우를 얻습니다. 두 가지 방식: 자신의 제공자 키를 가져오거나(BYOK), MemoryLake 호스팅 모델을 MemoryLake 키 하나로 사용하세요.
무상태 API는 매번 메모리를 다시 만들게 합니다
모든 LLM 호출은 무상태입니다. 연속성을 흉내 내려면 매 턴마다 전체 기록을 다시 보내야 하는데 — 느리고, 비싸고, 결국 컨텍스트 윈도우를 넘칩니다. 벡터 DB와 검색 파이프라인을 붙이면 해결되지만, 그것은 직접 구축하고 유지해야 하는 몇 주짜리 배관 작업입니다.
메모리 레이어가 없을 때
- 호출마다 전체 대화 기록 재전송 — 대화가 길어질수록 토큰 비용이 상승.
- 긴 세션은 컨텍스트 윈도우 한계에 부딪혀 작업 도중에 잘리기 시작.
- 메모리가 한 앱에만 존재 — 모델이나 세션을 바꾸면 컨텍스트가 사라짐.
직접 구축할 때
- 벡터 DB, 임베딩 파이프라인, 청킹, 검색 로직을 구축.
- 추출·중복 제거·관련성 랭킹을 작성하고 계속 튜닝.
- 지원하는 모든 제공자와 모델에서 유지보수.
Memory Router는 이 모든 것을 base URL 한 번의 변경으로 압축합니다. 프록시 자체가 메모리 레이어입니다.
네 단계의 투명 프록시
MemoryLake를 사용할 수 없으면 요청이 곧장 제공자로 통과합니다 — 다운타임 제로.
가로채기
앱이 제공자가 아닌 Memory Router로 요청을 보냅니다 — 동일한 페이로드, 동일한 SDK, 동일한 응답 형태.
컨텍스트 최적화
Router는 중복 기록을 잘라내고 이전 메모리를 검색해, 관련 컨텍스트만 프롬프트에 주입합니다.
전달
강화된 요청이 모델로 갑니다 — 자신의 제공자(BYOK) 또는 MemoryLake 호스팅 모델로. 원본 재전송보다 입력 토큰이 적습니다.
기억
새 메모리는 백그라운드에서 비동기로 추출·저장됩니다 — 응답은 절대 지연되지 않습니다.
BYOK 또는 MemoryLake 호스팅 — 당신의 선택
자신의 키를 가져오도록 강제하는 프록시와 달리, Memory Router는 두 방식 모두 지원합니다. 어느 쪽이든 변경은 base URL뿐 — 프롬프트, 스트리밍, 툴 호출 등 나머지는 그대로입니다.
자신의 키 가져오기
자신의 제공자 계정을 사용합니다. 당신의 키는 전송 중 암호화되어 호출마다 제공자로 전달되며, 당사 서버에 절대 저장되지 않습니다.
- 기존 OpenAI / Anthropic / Google 계정을 그대로 사용.
- 당신의 키, 당신의 과금, 당신의 속도 제한.
- 키는 암호화·통과 전용 — 저장하거나 로깅하지 않습니다.
MemoryLake 호스팅
제공자 계정이 필요 없습니다. MemoryLake가 주요 모델을 대신 실행하므로 MemoryLake API 키 하나만 있으면 시작할 수 있습니다.
- 모든 것을 키 하나로 — 따로 가입할 것이 없습니다.
- 주요 모델이 내장되어 바로 호출 가능.
- 메모리를 더해 출시하는 가장 간단한 방법.
키 안전성은 설계에서: BYOK 모드에서 제공자 키는 전송 중 암호화되어 호출마다 곧장 제공자로 전달됩니다. MemoryLake는 절대 저장·로깅·재사용하지 않습니다.
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://router.memorylake.ai/v1/openai",
apiKey: process.env.OPENAI_API_KEY, // your provider key
defaultHeaders: {
// encrypted in transit · passthrough only · never stored
"x-memorylake-api-key": process.env.MEMORYLAKE_API_KEY,
},
});import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://router.memorylake.ai/v1",
apiKey: process.env.MEMORYLAKE_API_KEY, // one key — that's it
});
// Pick any built-in model, e.g. "claude-opus-4-8" or "gpt-5".직접 구축하지 않는 메모리 인프라
한 줄 통합
base URL만 바꾸세요. SDK도 코드도 그대로.
BYOK 또는 호스팅
자신의 제공자 키를 가져오거나(암호화·미저장), MemoryLake 호스팅 모델을 키 하나로 사용하세요.
자동 컨텍스트 최적화
중복 기록을 제거하고 관련 메모리만 주입해 호출당 토큰을 줄입니다.
공유 메모리 풀
Router와 MemoryLake API가 같은 메모리를 읽고 씁니다 — 단일 진실 공급원.
우아한 폴백
MemoryLake를 사용할 수 없으면 요청이 곧장 제공자로 통과합니다. 다운타임 제로.
완전한 관측성
응답 헤더가 대화 ID, 컨텍스트 변경, 토큰 수, 생성·검색된 메모리를 보고합니다.
이미 사용 중인 제공자에서 작동
BYOK 모드에서는 제공자 계정과 키를 그대로 사용. 호스팅 모드에서는 MemoryLake가 이 모델들을 대신 실행합니다 — 두 방식 모두 같은 메모리 레이어.
| 제공자 | 상태 |
|---|---|
| OpenAI / GPT | 완전 지원 |
| Anthropic / Claude | 완전 지원 |
| Google Gemini | 완전 지원 |
| Groq, DeepSeek, OpenRouter | 완전 지원 |
| 모든 OpenAI 호환 엔드포인트 | 지원 |
| OpenAI Assistants API | 아직 미지원 |
모든 응답이 무슨 일이 있었는지 알려줍니다
Memory Router는 진단 헤더를 반환해 각 요청이 어떻게 처리됐는지 정확히 볼 수 있게 합니다 — 블랙박스가 아닙니다.
대화 ID
요청이 귀속된 스레드로, 턴을 묶어 검사할 수 있습니다.
컨텍스트 변경
이 호출에서 메모리가 주입됐는지, 기록이 잘렸는지.
토큰 수
최적화 후 전송된 토큰 수와 원본 재전송의 비교.
관여한 메모리
검색된 메모리 청크 수와 새로 생성된 수.
세 단계로 가동
- 1
MemoryLake 키 받기
MemoryLake에 가입하고 API 키를 생성하세요. Free 플랜은 시작용 메모리 저장소를 포함합니다.
- 2
모드 선택 + base URL 교체
SDK를 Router 엔드포인트로 향하게 하세요. BYOK라면 제공자 키를 유지하고 MemoryLake 키를 헤더로 추가. 호스팅이라면 MemoryLake 키만 사용.
- 3
평소처럼 호출
오늘과 똑같이 요청을 보내세요. 메모리는 자동으로 검색·저장되며 응답 헤더로 확인할 수 있습니다.
직접 API 호출 vs. Memory Router
대화가 길어질 때 호출당 전송 토큰
토큰 약 90% 절감| 제공자 직접 호출 | Memory Router 사용 | |
|---|---|---|
| 장기 메모리 | 직접 구축·호스팅 | 내장·자동 |
| 컨텍스트 윈도우 | 전부 재전송 후 잘림 | 최적화 — 중요한 것만 |
| 키와 계정 | 제공자 계정이 필요 | BYOK 또는 MemoryLake 키 하나만 |
| 코드 변경 | 새 SDK + 검색 파이프라인 | base URL 한 번 변경 |
| 세션·모델 전반 | 앱마다 메모리 격리 | 공유 메모리 풀 |
| 메모리 레이어 제공자 장애 | 직접 처리해야 함 | 우아한 통과 |
| 가시성 | 기본적으로 없음 | 진단 응답 헤더 |
자주 묻는 질문
코드를 바꿔야 하나요?
base URL과 헤더 하나뿐입니다. 프롬프트, 스트리밍, 툴 호출, 응답 처리는 동일하게 유지됩니다 — Memory Router는 제공자와 같은 API를 말합니다.
어떤 제공자를 지원하나요?
OpenAI, Anthropic, Google Gemini, Groq, DeepSeek, OpenRouter, 그리고 모든 OpenAI 호환 엔드포인트. OpenAI Assistants API는 아직 미지원입니다.
BYOK와 MemoryLake 호스팅의 차이는?
BYOK(자신의 키 가져오기)는 자신의 제공자 키와 MemoryLake 키를 함께 제공하는 방식으로, 과금과 속도 제한은 제공자 계정에 남습니다. 호스팅은 MemoryLake 키만 필요합니다: 주요 모델을 당사가 실행하므로 제공자 가입을 건너뜁니다.
BYOK 모드에서 제 제공자 키는 안전한가요?
네. 제공자 키는 전송 중 암호화되어 호출마다 제공자로 전달됩니다. MemoryLake는 절대 저장·로깅·재사용하지 않으며 통과만 합니다.
MemoryLake가 다운되면 어떻게 되나요?
BYOK 모드에서 Memory Router는 페일 오픈입니다: 요청이 곧장 제공자로 통과해 앱이 다운타임 제로로 계속 작동합니다.
어떻게 토큰을 줄이나요?
매 턴 전체 기록을 재전송하는 대신, Router는 중복 컨텍스트를 제거하고 관련 메모리만 주입합니다 — 대화가 길어질수록 호출당 토큰이 줄어듭니다.
메모리는 MemoryLake API와 공유되나요?
네. Router와 MemoryLake API는 같은 메모리 풀에서 작동하므로 한쪽에 저장한 것을 다른 쪽에서 검색할 수 있습니다.
무료 플랜이 있나요?
네. Memory Router는 Free 플랜에서 사용할 수 있어 확장 전에 통합하고 테스트할 수 있습니다.
모든 LLM에 메모리를 — URL 하나만 바꾸세요.
컨텍스트 재전송과 검색 재구축을 멈추세요. SDK를 Memory Router로 향하게 하고 오늘 메모리를 출시하세요.