记录技术与生活的点滴

23 篇文章

Claude Code 上下文管理机制:从 Microcompact 到 Auto Compact

这篇文章整理的是 Claude Code 上下文管理机制的源码阅读笔记。先给结论: Claude Code 的上下文管理不是一个固定的“60% 用 A、70% 用 B、80% 用 C”的十层阶梯。更准确地说,它是三部分组合: 请求前的轻量...

阅读 →

GoFoundry 项目详解:基于 Go 的后端基础框架套件设计

GoFoundry 是一个基于 Go 的后端基础框架套件项目。它不是单独实现一个 Web 框架,也不是只写一个 ORM,而是围绕后端基础设施中最常见的几类能力做模块化重构:Web 框架、ORM、分布式缓存、分布式锁、消息队列和压测工具。 项...

阅读 →

CloudVault 项目详解:基于 Go 的云端存储与网盘系统架构设计

CloudVault 是一个基于 Go 的云端存储与网盘系统,面向大文件传输、高并发访问和文件管理场景设计。它的核心目标不是简单做一个“文件上传下载 Demo”,而是围绕真实网盘系统中的关键问题展开:大文件如何稳定上传、分片如何管理、断点续...

阅读 →

Week 2:GPU 与推理加速——从 Kernel、算子融合到 LLM Serving

Week 1 我们从 Autograd 理解了深度学习框架的训练本质:Tensor、计算图、反向传播和内存优化。Week 2 要切到更贴近论文和系统落地的部分:GPU 与推理加速。 如果说训练框架的核心问题是“如何自动求梯度”,那么推理系统...

阅读 →

无锁并发入门:从 CAS 到 Atomic Ring Buffer

这篇文章整理几个无锁并发里经常一起出现的概念:CAS、busy polling、atomic ring buffer、release/acquire、store buffer 和 CPU cache warmup。它们看起来分散,...

阅读 →