Writing
Thoughts on engineering, AI, and tools.
MiniCPM :端侧 LLM 的效率路线
从 MiniCPM4、InfLLM-V2、SALA 到 BitCPM4,梳理 MiniCPM 系列在端侧推理和长上下文效率上的技术取舍。
Google Gemma 4:一次真正意义上的代际跨越
Gemma 4 四种尺寸全系列原生多模态,Apache 2.0 开源,Agent 能力 +1200%——不只是性能提升,是结构性跨越。
Harness Engineering:AI Agent 时代真正缺的那块拼图
Harness Engineering 不是新模型也不是新框架,而是一种工程思路的命名——让无数工程师感到如释重负的命名。
Strategy Gene:让 Agent 真正学会而不是记住
基于 arXiv:2604.15097,探讨如何通过 Strategy Gene 让 Agent 系统真正习得策略,而非依赖文档堆叠的硬编码记忆。