La respuesta corta
Perplexity olvida tus consultas anteriores porque cada Hilo está aislado: las preguntas de seguimiento solo se encadenan dentro del Hilo que las inició, y un nuevo Hilo, incluso dentro del mismo Espacio, comienza en blanco. El Historial de Búsqueda almacena títulos para que los navegues, pero el modelo no carga Hilos anteriores como contexto para los nuevos. La solución es una capa de memoria externa que captura el historial de consultas y lo retroalimenta en cada nuevo Hilo.
Por qué Perplexity olvida tus consultas anteriores
El producto de Perplexity está diseñado para respuestas rápidas y fundamentadas en citas, una pregunta a la vez. La arquitectura que hace eso rápido también debilita la continuidad de las consultas.
1. Los Hilos son conversaciones aisladas. Las preguntas de seguimiento se encadenan dentro de un Hilo, pero Perplexity trata cada nuevo Hilo como una sesión nueva. El modelo no carga automáticamente el Hilo de ayer en el contexto de hoy, incluso cuando ambos Hilos están dentro del mismo Espacio.
2. El Historial de Búsqueda es para ti, no para el modelo. Tus consultas pasadas aparecen en el Historial para que puedas revisarlas, pero no se retroalimentan en nuevas consultas como contexto. El historial es una facilidad de la interfaz de usuario, no una capa de memoria.
3. Los Espacios añaden instrucciones, no memoria de consulta. Un Espacio proporciona a cada Hilo dentro de él un conjunto de instrucciones compartidas y un conjunto de archivos compartidos. No da acceso a cada Hilo dentro de él a las preguntas y respuestas reales de los Hilos hermanos.
El resultado: Perplexity es excelente para responder bien a la pregunta de hoy. Pierde la cadena de razonamiento que te llevó de la pregunta de ayer a la de hoy.
Lo que pierdes cuando Perplexity olvida consultas anteriores
Cada nuevo Hilo te cuesta de 5 a 15 minutos de re-establecimiento, y el costo se acumula en un proyecto de investigación real:
- Las cadenas de razonamiento se rompen. "Reducimos los proveedores candidatos de 12 a 3 en el último Hilo basado en el filtro de certificación" se convierte en un hecho que Perplexity ya no retiene, por lo que vuelve a abrir la lista completa de 12 candidatos.
- Las preferencias de fuentes se reinician. El puñado de fuentes que rechazaste ayer por estar desactualizadas aparece nuevamente hoy como las principales citas.
- Las preguntas refinadas se vuelven imprecisas. La pregunta precisa de ayer, afinada a través de seis seguimientos, se convierte en la pregunta imprecisa de hoy, afinada desde cero.
La solución no es "mantener un Hilo abierto para siempre." Los Hilos largos se ralentizan, alcanzan límites y la calidad de los seguimientos disminuye. La solución es desacoplar la memoria de consulta de la memoria del Hilo.
Soluciones integradas de Perplexity
Perplexity ha lanzado algunas características que abordan este problema. Ninguna de ellas cierra la brecha.
Los Hilos encadenan los seguimientos dentro de una conversación y preservan bien el contexto dentro del Hilo. No comparten contexto con Hilos hermanos, por lo que el límite de la memoria es el Hilo mismo.
Los Espacios delimitan un proyecto a un espacio de trabajo con instrucciones y fuentes compartidas, elevando el nivel de cada Hilo dentro de ese espacio de trabajo. No pasan el historial de consultas entre Hilos, por lo que el estado de razonamiento aún se reinicia cuando abres un nuevo Hilo.
El Historial de Búsqueda mantiene una lista navegable de tus consultas anteriores. Es útil cuando deseas reabrir un Hilo manualmente, pero no se retroalimenta en el modelo como contexto, por lo que no detiene el olvido.
Puedes leer la propia descripción de Perplexity sobre estas características en el Centro de Ayuda de Perplexity.
Para preguntas puntuales, los nativos están bien. Para consultas continuas, tienen fugas.
Dónde falla la memoria integrada de Perplexity
El problema más profundo es que tu consulta rara vez se queda dentro de un solo producto. Preguntas en Perplexity, validas en Claude, redactas en ChatGPT y verificas los números en una hoja. Cada herramienta tiene su propio registro de consultas, ninguna de ellas se comunica, y la cadena de razonamiento se fragmenta. Los Espacios resuelven una parte del problema dentro de Perplexity. No resuelven nada en el segundo en que cambias de pestaña.
Esa es la brecha que llena una capa de memoria entre herramientas: una memoria de consulta, escrita por Perplexity, leída por cada otra IA que usas.
Cómo MemoryLake soluciona el olvido de consultas anteriores en Perplexity
MemoryLake es una capa de memoria entre modelos que se sitúa entre tú y cada IA que usas. En lugar de depender del sandbox por Hilo de Perplexity, le das a la línea de consulta su propio Proyecto de MemoryLake, y Perplexity lee de ese Proyecto al inicio de cada nuevo Hilo.
- Memoria de consulta por proyecto. Las preguntas, respuestas y pasos de refinamiento pasados se almacenan contra el proyecto, no contra el Hilo. Abre un nuevo Hilo y el razonamiento previo ya está cargado.
- 10,000 veces más contexto que la indicación en bruto. El motor de recuperación de MemoryLake lee de miles de millones de tokens de historial de consultas y alimenta a Perplexity solo las partes relevantes para la pregunta actual. Dejas de pegar resúmenes.
- Portátil a cada otra IA. La misma memoria de consulta funciona en Claude, ChatGPT, Grok, Gemini y Cursor. Cuando dejas Perplexity para redactar o analizar, la cadena de razonamiento sigue.
MemoryLake obtuvo un 94.03% en el benchmark de contexto largo LoCoMo, el mejor resultado publicado hasta 2026, con recuperación en milisegundos y cifrado de extremo a extremo AES-256.
Conectar MemoryLake a Perplexity en 3 pasos
- Crea un proyecto y carga tus consultas anteriores. Inicia sesión en MemoryLake, abre la Gestión de Proyectos, haz clic en Crear Proyecto y nómbralo según la línea de consulta (por ejemplo, "Perplexity - evaluación de proveedores Q2"). Pega las preguntas y respuestas clave de Hilos anteriores en la pestaña de Memorias para que viajen con el proyecto, y coloca cualquier documento de referencia en la Unidad de Documentos.
- Genera un punto final del Servidor MCP. Abre la pestaña de Servidores MCP dentro de tu proyecto, haz clic en Agregar Servidor MCP, nómbralo "integración de Perplexity" y haz clic en Generar. MemoryLake devuelve un ID de clave API, un secreto y una URL de punto final. Copia el secreto de inmediato, ya que solo se muestra una vez.
- Conecta Perplexity. Perplexity aún no admite MCP de forma nativa en las aplicaciones para consumidores, así que usa la API REST con tu token Bearer para obtener el historial de consultas del proyecto antes de cada nuevo Hilo, o pega un breve aviso en la parte superior de un nuevo Hilo que haga referencia a tu proyecto de MemoryLake. Los desarrolladores que usan la API Sonar de Perplexity pueden llamar al SDK de Python para inyectar consultas anteriores por turno.