简短的答案
Perplexity 忘记你之前的查询是因为每个 Thread 都是沙盒化的:后续问题仅在启动它们的 Thread 内链式连接,而即使在同一个 Space 内,新 Thread 也是空白的。搜索历史为你存储标题以供浏览,但模型不会将早期的 Threads 作为新 Threads 的上下文加载。解决方案是一个外部记忆层,它捕捉查询历史并将其反馈到每个新 Thread 中。
为什么 Perplexity 会忘记你之前的查询
Perplexity 的产品是为快速、基于引用的答案而构建的,一次一个问题。使其快速的架构也使得查询的延续性变得薄弱。
1. Threads 是独立的对话。 后续问题在一个 Thread 内链式连接,但 Perplexity 将每个新 Thread 视为一个新的会话。即使两个 Threads 位于同一个 Space,模型也不会自动将昨天的 Thread 加载到今天的上下文中。
2. 搜索历史是为你而非模型。 你的过去查询出现在历史中,以便你可以重新访问它们,但它们不会作为上下文反馈到新查询中。历史是一个用户界面功能,而不是一个记忆层。
3. Spaces 添加指令,而不是查询记忆。 一个 Space 为其中的每个 Thread 提供共享的指令集和共享的文件池。它并不为其中的每个 Thread 提供对兄弟 Threads 的实际问题和答案的访问。
结果是:Perplexity 在回答今天的问题时表现出色。它失去了将你从昨天的问题引导到今天的推理链。
当 Perplexity 忘记之前的查询时你会失去什么
每个新 Thread 都会让你花费 5-15 分钟重新建立基础,而这个成本在实际研究项目中会累积:
- 推理链断裂。 "我们在上一个 Thread 中根据认证过滤器将候选供应商从 12 个缩减到 3 个" 变成了 Perplexity 不再持有的事实,因此它重新打开了完整的 12 个候选列表。
- 来源偏好重置。 你昨天因过时而拒绝的少数来源今天又作为顶级引用出现。
- 精炼的问题变得模糊。 昨天的紧凑问题,在六个后续中被磨练,变成了今天的松散问题,从头开始磨练。
解决方案不是“永远保持一个 Thread 打开”。长 Threads 会变慢,达到限制,后续质量下降。解决方案是将查询记忆与 Thread 记忆分离。
Perplexity 的内置解决方法
Perplexity 发布了一些触及这个问题的功能。它们都没有弥补这个差距。
Threads 在一个对话内链式连接后续问题,并很好地保留了 Thread 内的上下文。它们不与兄弟 Threads 共享上下文,因此记忆的边界就是 Thread 本身。
Spaces 将项目范围限制在一个具有共享指令和来源的工作区,提高了该工作区内每个 Thread 的基础。它们不会在 Threads 之间传递查询历史,因此当你打开一个新 Thread 时,推理状态仍然会重置。
搜索历史 保持你之前查询的可浏览列表。当你想手动重新打开一个 Thread 时,它是有帮助的,但它不会作为上下文反馈到模型中,因此无法阻止遗忘。
你可以在 Perplexity 帮助中心 阅读 Perplexity 对这些功能的描述。
对于一次性问题,原生功能很好。对于持续的询问,它们会泄漏。
Perplexity 的内置记忆不足之处
更深层次的问题是,你的询问很少停留在一个产品内。你在 Perplexity 中提问,在 Claude 中验证,在 ChatGPT 中草拟,并在表格中检查数字。每个工具都有自己的查询日志,它们之间没有沟通,推理链被分割。Spaces 在 Perplexity 内解决了一部分问题。你切换标签的那一刻,它们就解决不了任何问题。
这就是跨工具记忆层填补的差距:一个查询记忆,由 Perplexity 编写,供你使用的每个其他 AI 阅读。
MemoryLake 如何修复 Perplexity 忘记之前的查询
MemoryLake 是一个跨模型记忆层,位于你与每个使用的 AI 之间。你不再依赖 Perplexity 的每个 Thread 沙盒,而是为询问线提供自己的 MemoryLake 项目,Perplexity 在每个新 Thread 开始时从该项目中读取。
- 每个项目的查询记忆。 过去的问题、答案和精炼步骤存储在项目中,而不是 Thread 中。打开一个新 Thread,之前的推理已经加载。
- 比原始提示多 10,000 倍的上下文。 MemoryLake 的检索引擎从数十亿个查询历史的标记中读取,并仅将与当前问题相关的片段反馈给 Perplexity。你不再需要粘贴回顾。
- 可移植到其他 AI。 相同的查询记忆可以在 Claude、ChatGPT、Grok、Gemini 和 Cursor 中使用。当你离开 Perplexity 进行草拟或分析时,推理链会随之而来。
MemoryLake 在 LoCoMo 长上下文基准测试中得分 94.03%,这是截至 2026 年的最高已发布结果,具有毫秒级检索和 AES-256 端到端加密。
在 3 个步骤中将 MemoryLake 连接到 Perplexity
- 创建项目并加载你的之前查询。 登录 MemoryLake,打开项目管理,点击创建项目,并根据询问线命名(例如,“Perplexity - 供应商审核 Q2”)。将过去 Threads 中的关键问题和答案粘贴到记忆标签中,以便它们随项目一起移动,并将任何参考文档放入文档驱动器。
- 生成 MCP 服务器端点。 在项目内打开 MCP 服务器标签,点击添加 MCP 服务器,命名为“Perplexity 集成”,然后点击生成。MemoryLake 返回一个 API 密钥 ID、密钥和端点 URL。立即复制密钥,因为它只显示一次。
- 连接 Perplexity。 Perplexity 目前尚不支持在消费者应用中原生使用 MCP,因此使用 REST API 和你的 Bearer 令牌在每个新 Thread 之前获取项目的查询历史,或者在新 Thread 顶部粘贴一个简短的提示,引用你的 MemoryLake 项目。使用 Perplexity Sonar API 的开发者可以调用 Python SDK 在每个回合中注入之前的查询。