检索速度狂飙 948 倍!Google DeepMind 推出 STATIC 框架,攻克 LLM 生成式检索难题 在现代工业推荐系统中,基于大语言模型(LLM)的“生成式检索(GR)”正逐渐取代传统的嵌入式搜索。然而,这种模式在实际应用中面临一个棘手问题:模型容易“胡言乱语”,生成不存在的商品 ID 或违反库存逻... AI资讯# GoogleDeepMind# STATIC# 大语言模型 1周前0160
读完 500 万篇新闻,谷歌 Gemini 成功预测全球山洪灾害 山洪暴发因其突发性和局部性,一直是全球气象预报中最难攻克的“幽灵”灾害。今日,谷歌宣布通过一种极具创意的方案破解了这一难题:利用大语言模型挖掘新闻报道中的非结构化数据,成功构建了覆盖全球的山洪预测体系... AI资讯# 大语言模型# 山洪暴发# 山洪预测体系 1周前070
毁灭性风险!研究发现 AI 在 95% 模拟核危机中倾向选择“核打击” 当人工智能掌握了核武器的“发射按钮”,世界会变得更安全吗?伦敦国王学院教授肯尼斯·佩恩的一项最新研究给出了令人不寒而栗的答案。实验显示,在模拟核危机场景中,大语言模型(LLM)更倾向于升级冲突,甚至在... AI资讯# AI新词# 人工智能# 大语言模型 1周前070
杨立昆进军“世界模型”:其 AI 初创公司完成 10.3 亿美元融资 图灵奖得主、Meta 前首席人工智能科学家杨立昆(Yann LeCun)创办的初创公司 Advanced Machine Intelligence (AMI) 周二宣布,已成功筹集 10.3 亿美元 ... AI资讯# AI系统# AMI# 大语言模型 1周前050
Unsloth Studio 发布:首个本地可视化大模型微调平台,显存占用降低 70% 知名高性能微调库 Unsloth AI 正式推出了 Unsloth Studio。这是一款开源、无代码的本地可视化界面,旨在大幅降低软件工程师微调大语言模型(LLM)的门槛,让开发者彻底告别复杂的 C... AI资讯# Triton# UnslothAI# UnslothStudio 1周前0130
小而强、轻而快!通义千问 Qwen3.5 推出多款小尺寸模型,适配消费级显卡 阿里通义实验室宣布,正式推出其最新一代大语言模型 Qwen3.5的系列小尺寸版本。本次发布的模型涵盖了0.8B、2B、4B 以及9B 四种参数规模,旨在通过极致的性能优化,降低 AI 技术的应用门槛... AI资讯# Qwen3.5# 大语言模型# 小尺寸版本 1周前070
xAI发布Grok4.20:推理性能提升显著,不幻觉率78%创行业纪录 2026年3月12日,xAI正式发布新一代大语言模型Grok4.20Beta,该模型在保持价格竞争力的同时,凭借极高的事实可靠性刷新了行业纪录。根据Artificial Analysis的最新评估,G... AI资讯# AI新词# Grok4.20Beta# xAI 1周前0100
技术优化仍需打磨:Meta 宣布 Llama4发布计划推迟至5月 据知情人士透露,Meta 已决定将其备受期待的新一代大语言模型 Llama4的发布时间至少推迟至今年5月。尽管扎克伯格曾多次表达对该模型的厚望,但研发团队在基础模型的性能微调与逻辑推理优化过程中遇到了... AI资讯# AI新词# Llama4# Meta 1周前060
体积减半性能不减!西班牙 Multiverse 靠量子压缩术挑战 OpenAI 针对大语言模型(LLM)体积臃肿、部署成本高昂的痛点,西班牙 AI 初创公司 Multiverse Computing 正在通过独特的“压缩术”打破僵局,试图在企业级 AI 市场与 OpenAI 等巨... AI资讯# CompactifAI# HyperNova60B# MultiverseComputing 4周前070
日本数据科学家推出“零错误”编程语言 Sui,声称让大模型写代码准确率达100% 在大模型生成代码仍饱受语法错误、命名混乱和上下文依赖困扰的当下,日本数据科学家本田崇人(Takato Honda)带来了一套激进的解决方案:一门名为 **Sui**(粋)的全新编程语言。其名称取自日本... AI资讯# AI编程# Sui# 大语言模型 1个月前0300