英伟达推出 Nemotron 3:混合架构提升 AI 代理处理效率 英伟达近日发布了其全新的 Nemotron 3 系列,这一系列产品结合了 Mamba 和 Transformer 两种架构,旨在高效处理长时间上下文窗口,同时减少资源消耗。Nemotron 3 系列专... AI资讯# Mamba# Nemotron3# Transformer 2个月前0110
DeepSeek 推出 Engram 模块:为稀疏大模型植入“条件记忆轴”,效率大幅提升 传统的 Transformer 模型在处理重复性知识时往往显得有些“浪费”,每次遇到相同的模式都需要重新计算,这不仅消耗深度也浪费了计算资源。为了打破这一瓶颈,DeepSeek 的研究团队近日推出了一... AI资讯# Engram# N-gram# Transformer 2个月前0240
哈萨比斯达沃斯再评中国AI:领先仅6个月,但“突破性创新”仍是关键差距 在 2026 年达沃斯世界经济论坛上,DeepMind首席执行官德米斯·哈萨比斯对全球AI格局作出最新研判:**中国AI公司整体技术实力已非常接近西方,差距缩小至约 6 个月**——这一判断比此前“数... AI资讯# AI新词# DeepSeek# Transformer 2个月前0270
马斯克宣布 X 平台推荐算法正式开源:基于 Grok 模型架构,每四周迭代更新 根据 AIbase 报道,埃隆·马斯克于2026年1月20日正式宣布开源 X 平台(原推特)的新一代推荐算法。此次开源的算法由 xAI 的 Grok 模型同款 Transformer 架构驱动。马斯克... AI资讯# AIbase# Grok# Transformer 2个月前0290