据财联社报道,阿里巴巴新一代基座模型 Qwen3.5 已在 HuggingFace 的 Transformers 项目中出现代码合并申请(PR),预示发布在即。
据悉,Qwen3.5采用了全新的混合注意力机制,并极有可能是一款原生支持视觉理解的 VLM 模型。目前开发者挖掘的信息显示,Qwen3.5预计将开源至少 2B 的密集模型以及 35B-A3B 的 MoE 模型。此前有消息称,该系列模型将在今年春节期间正式开源。

© 版权声明
本网转发此文章,旨在为读者提供更多信息资讯,只用于分享,不做任何商业用途,版权归原作者所有。由于条件所限,在转载之前无法与所有权利人联系授权,可能出现部分原创图片或文字未署名,请联系添加。如有侵权,请联系删除处理。
相关文章
暂无评论...
