据 AIbase 报道,正值 DeepSeek-R1发布一周年之际,DeepSeek 下一代旗舰模型的线索已悄然浮出水面。结合 The Information 的爆料,这款备受期待的新模型(或为 DeepSeek V4)最快有望于今年2月中旬(农历新年期间)正式登场,并预计带来更强悍的代码生成能力。

开发者在 DeepSeek 的 GitHub 仓库中发现,其更新的 FlashMLA 代码库中,横跨114个文件有多达28处引用了名为 “MODEL1” 的神秘标识符。代码逻辑显示,“MODEL1” 是一个区别于现有 “V32”(DeepSeek-V3.2)的全新架构。二者的关键差异体现在键值(KV)缓存布局、稀疏性处理方式以及 FP8数据格式的解码支持上,这表明新模型在内存优化和计算效率方面进行了针对性的底层重构。
此前,DeepSeek 团队已陆续发布了关于“优化残差连接(mHC)”和受生物学启发的“AI 记忆模块(Engram)”等技术论文。业界普遍猜测,这些最新的研究成果极有可能被整合进正在开发的“MODEL1”中,为这款即将发布的新旗舰提供核心技术支撑。
© 版权声明
本网转发此文章,旨在为读者提供更多信息资讯,只用于分享,不做任何商业用途,版权归原作者所有。由于条件所限,在转载之前无法与所有权利人联系授权,可能出现部分原创图片或文字未署名,请联系添加。如有侵权,请联系删除处理。
相关文章
暂无评论...
