Writing

Thoughts on engineering, AI, and tools.

MiniCPM :端侧 LLM 的效率路线

从 MiniCPM4、InfLLM-V2、SALA 到 BitCPM4,梳理 MiniCPM 系列在端侧推理和长上下文效率上的技术取舍。

May 14, 2026

Google Gemma 4:一次真正意义上的代际跨越

Gemma 4 四种尺寸全系列原生多模态,Apache 2.0 开源,Agent 能力 +1200%——不只是性能提升,是结构性跨越。

May 10, 2026

Harness Engineering:AI Agent 时代真正缺的那块拼图

Harness Engineering 不是新模型也不是新框架,而是一种工程思路的命名——让无数工程师感到如释重负的命名。

May 10, 2026

Strategy Gene:让 Agent 真正学会而不是记住

基于 arXiv:2604.15097,探讨如何通过 Strategy Gene 让 Agent 系统真正习得策略,而非依赖文档堆叠的硬编码记忆。

May 10, 2026