大型语言模型(LLM)Agent 在长周期任务中面临一个根本性的瓶颈:有限的上下文窗口。在涉及数十至数百步骤、需要频繁调用工具的复杂任务中(如搜索与交叉引用科学文献、探索代码配置空间、编排多API业务流程等),Agent 的执行轨迹会随时间不断增长,导致上下文窗口迅速被占满。
现有的解决方案主要依赖两类方法:(1)截断/滑动窗口——直接丢弃历史内容,简单粗暴但会永久丢失关键信息;(2)运行摘要(running summary)——将历史轨迹压缩成一段自然语言摘要,但这本质上是一种有损压缩,摘要无法精确还原细粒度的工具输出、代码片段或特定数值结果,导致后续步骤中 Agent 无法可靠地重用之前的证据。此外,基于语义相似度检索的方法(如 RAG)在长周期工具使用场景中也存在问题:记忆库中充斥大量近似重复的噪声片段,使得检索结果模糊,Agent 需要反复重新解析历史信息,效率极低。
研究者指出,现有方法的核心缺陷在于:它们在减少活跃上下文的同时,都不可避免地丢弃了原始证据本身。一个真正有效的方案应当能够在压缩上下文的同时保留完整的历史证据,使 Agent 可以按需精准取回特定的过去内容。这正是 Memex 框架所要解决的核心问题。