2025年5月14日,谷歌 DeepMind 在官网宣布推出用于设计高级算法的编程 AI Agent——AlphaEvolve。它与谷歌的大模型 Gemini 深度集成,能自动评估通用算法的发现与优化,助力开发人员高效设计优质、高效的矩阵算法。
为展现 AlphaEvolve 的能力,谷歌让其挑战有着 300 多年历史的数学难题 —— 亲吻数问题。该问题最早可追溯至 1694 年,难点在于确定在给定维度的空间中,最多能有多少个相同大小的球体同时与一个中心球体接触,且这些球体之间不会发生重叠1。AlphaEvolve 成功发现了由 593 个外层球体组成的结构型,在 11 维空间中建立了新的下界,超越了此前数学家们创造的纪录。
除解决亲吻数问题外,AlphaEvolve 还在其他方面有着出色表现:
- 改进矩阵乘法算法:它找到了一种用于 4×4 复值矩阵乘法的算法,仅需 48 次标量乘法,改进了 Strassen 在 1969 年提出的算法,而 Strassen 算法此前被认为是该场景下的最佳算法。
- 提升计算效率:通过将大规模矩阵乘法运算拆解为更易处理的子问题,使 Gemini 模型架构中的核心计算效率提升了 23%,整体训练时间缩短了 1%。还能对 GPU 底层指令进行优化,在基于 Transformer 的人工智能模型中,实现了 FlashAttention 核心计算最高达 32.5% 的加速。
- 解决多领域问题:应用于超过 50 个数学领域的开放问题,在近 75% 的案例中重新发现了最先进的解决方案,在 20% 的案例中改进了已知的最佳方案。例如,在多个自相关不等式问题上改进了已知最优界值;通过优化傅里叶分析中不确定性原理构造,生成了一种改进的配置,略微提高了上界;在给定形状内布置 N 个点,优化最大与最小距离比,实现多边形最优嵌套填充,改进 Heilbronn 问题变体等。
此外,AlphaEvolve 还发现了一种简单却非常高效的启发式方法,帮助谷歌大规模集群管理系统 Borg 更高效地调度谷歌庞大的数据中心,该方案已投入生产使用超过一年,平均持续恢复 0.7% 的全球计算资源。它还提出了一种新的 Verilog 重写方法,有效去除了矩阵乘法运算电路中的不必要位数,这一改进已被整合到了谷歌即将推出的张量处理单元(TPU)中,能够提升芯片性能。
© 版权声明
本网转发此文章,旨在为读者提供更多信息资讯,只用于分享,不做任何商业用途,版权归原作者所有。由于条件所限,在转载之前无法与所有权利人联系授权,可能出现部分原创图片或文字未署名,请联系添加。如有侵权,请联系删除处理。