Gu EnHao Blog

2026年5月19日技术

Claude Code 上下文管理机制：从 Microcompact 到 Auto Compact

这篇文章整理的是 Claude Code 上下文管理机制的源码阅读笔记。先给结论： Claude Code 的上下文管理不是一个固定的“60% 用 A、70% 用 B、80% 用 C”的十层阶梯。更准确地说，它是三部分组合：请求前的轻量...

# LLM # Agent # AI Infra

阅读 →

2026年5月10日 AI

这篇文章选一个真正和“大模型训练”强相关的开源项目来讲：Hugging Face 的 Nanotron。项目地址：https://github.com/huggingface/nanotron Nanotron 是 Hugging Fac...

# LLM # AI Infra # PyTorch

阅读 →

2026年5月5日技术

Week 1 我们从 Autograd 理解了深度学习框架的训练本质：Tensor、计算图、反向传播和内存优化。Week 2 要切到更贴近论文和系统落地的部分：GPU 与推理加速。如果说训练框架的核心问题是“如何自动求梯度”，那么推理系统...

# LLM # 深度学习 # CMU 10-414

阅读 →

2026年4月24日技术

做 Agent 项目绕不开一个问题：大模型本身没有记忆，每次调用都是无状态的。所谓”记忆”，本质上是把历史信息塞进下一次请求的 prompt 里。这篇文章从原理出发，整理三种主流实现方案。...

# LLM # Agent # RAG

阅读 →

2026年4月24日技术

做 Agent 项目时，对话持续进行，token 会不断累积，迟早超出模型的 context window。这篇文章整理一套五层上下文压缩机制，从轻到重依次触发，核心思路是”能少压就少压，实在不行再大压”。...

# LLM # Agent # 面试

阅读 →

2026年4月6日技术

MiniCode 是一个轻量级终端 AI 编程助手，类 Claude Code 工作流，181 ⭐。整个核心只有 5000 行 TypeScript，依赖极简（只有 diff 和 zod 两个运行时依赖），非常适合学习 AI Agent 的...

# LLM # 面试 # 源码分析

阅读 →