0508日报 | 小型化的极致智能
今天的信号指向一个关键词:「小型化的极致智能」。Zyphra用760M活跃参数的ZAYA1-8B在数学推理上超越GPT-5-High,用的还是AMD芯片——这不仅是「小模型挑战大模型」的又一个案例,更是「推理能力可以被压缩」的实证。DFlash用扩散模型做投机解码,将推理加速变成了一个模型压缩问题。Sakana的7B RL Conductor学会了编排GPT-5和Claude Sonnet 4——
今天的信号指向一个关键词:「小型化的极致智能」。Zyphra用760M活跃参数的ZAYA1-8B在数学推理上超越GPT-5-High,用的还是AMD芯片——这不仅是「小模型挑战大模型」的又一个案例,更是「推理能力可以被压缩」的实证。DFlash用扩散模型做投机解码,将推理加速变成了一个模型压缩问题。Sakana的7B RL Conductor学会了编排GPT-5和Claude Sonnet 4——