记录技术与生活的点滴

23 篇文章

Agent 对话记忆化:从原理到实现

做 Agent 项目绕不开一个问题:大模型本身没有记忆,每次调用都是无状态的。所谓”记忆”,本质上是把历史信息塞进下一次请求的 prompt 里。这篇文章从原理出发,整理三种主流实现方案。...

阅读 →

LLM 上下文五层压缩机制详解

做 Agent 项目时,对话持续进行,token 会不断累积,迟早超出模型的 context window。这篇文章整理一套五层上下文压缩机制,从轻到重依次触发,核心思路是”能少压就少压,实在不行再大压”。...

阅读 →

C++ 并发编程入门:从数据竞争到线程池

量化开发面试必考并发编程,但很多人第一次接触就直接看线程池代码,结果一头雾水。这篇文章从最基础的数据竞争开始,一步步推导出有界阻塞队列和线程池,每个概念都从”它解决什么问题”出发。...

阅读 →