MedDocOCR-Interpreter 源码导读:医疗文档 OCR、结构化抽取与报告解读原型
MedDocOCR-Interpreter 是一个面向医疗单据的 OCR 与报告解读原型项目。它的目标不是直接训练一个完整医疗大模型,而是先把“医疗文档从图片/文本到结构化结果,再到可解释解读”的工程链路搭起来:输入可以是检验报告...
记录技术与生活的点滴
MedDocOCR-Interpreter 是一个面向医疗单据的 OCR 与报告解读原型项目。它的目标不是直接训练一个完整医疗大模型,而是先把“医疗文档从图片/文本到结构化结果,再到可解释解读”的工程链路搭起来:输入可以是检验报告...
整理 10 篇大学英语六级写作高频话题范文。每篇控制在六级常见篇幅内,结构尽量固定:现象/观点引入 → 原因或论证 → 做法/总结。背诵时优先背开头、转折句和结尾句,再替换关键词迁移到其他题目。 打印背诵版 PDF:下...
这篇文章整理的是 Claude Code 上下文管理机制的源码阅读笔记。先给结论: Claude Code 的上下文管理不是一个固定的“60% 用 A、70% 用 B、80% 用 C”的十层阶梯。更准确地说,它是三部分组合: 请求前的轻量...
这篇文章选一个真正和“大模型训练”强相关的开源项目来讲:Hugging Face 的 Nanotron。 项目地址:https://github.com/huggingface/nanotron Nanotron 是 Hugging Fac...
GoFoundry 是一个基于 Go 的后端基础框架套件项目。它不是单独实现一个 Web 框架,也不是只写一个 ORM,而是围绕后端基础设施中最常见的几类能力做模块化重构:Web 框架、ORM、分布式缓存、分布式锁、消息队列和压测工具。 项...
CloudVault 是一个基于 Go 的云端存储与网盘系统,面向大文件传输、高并发访问和文件管理场景设计。它的核心目标不是简单做一个“文件上传下载 Demo”,而是围绕真实网盘系统中的关键问题展开:大文件如何稳定上传、分片如何管理、断点续...
OpenClaw 是一个开源的个人 AI 助手项目。它的定位不是单纯的聊天网页,也不是只有一个 CLI,而是一个“运行在自己设备上的多通道 AI 助手”:用户可以通过 WhatsApp、Telegram、Slack、Discord、Goog...
Flow Matching 是近几年生成模型里非常重要的一条路线。它和 Diffusion Model 关系很近,但视角更直接:不再把生成过程理解成“一步步去噪”,而是学习一个连续的速度场,让噪声样本沿着这条流逐渐移动到真实数据分布。 一句...
Week 1 我们理解了 Autograd,Week 2 理解了 GPU 推理加速,Week 3 理解了分布式系统。Week 4 要补的是数据库,但目标不是成为数据库内核工程师,而是学会用数据库视角理解 AI 系统里的 Vector DB、...
Week 1 我们用 mini autograd 理解了深度学习框架的本质;Week 2 我们从 GPU、Kernel、KV cache 和 batching 理解了推理系统的性能瓶颈。Week 3 要补的是另一块底层能力:分布式系统思想。...