Week 2:GPU 与推理加速——从 Kernel、算子融合到 LLM Serving
Week 1 我们从 Autograd 理解了深度学习框架的训练本质:Tensor、计算图、反向传播和内存优化。Week 2 要切到更贴近论文和系统落地的部分:GPU 与推理加速。 如果说训练框架的核心问题是“如何自动求梯度”,那么推理系统...
记录技术与生活的点滴
Week 1 我们从 Autograd 理解了深度学习框架的训练本质:Tensor、计算图、反向传播和内存优化。Week 2 要切到更贴近论文和系统落地的部分:GPU 与推理加速。 如果说训练框架的核心问题是“如何自动求梯度”,那么推理系统...