大语言模型 - AI工具集

检索速度狂飙 948 倍！Google DeepMind 推出 STATIC 框架，攻克 LLM 生成式检索难题

在现代工业推荐系统中，基于大语言模型（LLM）的“生成式检索(GR)”正逐渐取代传统的嵌入式搜索。然而，这种模式在实际应用中面临一个棘手问题:模型容易“胡言乱语”，生成不存在的商品 ID 或违反库存逻...

1周前

0160

读完 500 万篇新闻，谷歌 Gemini 成功预测全球山洪灾害

山洪暴发因其突发性和局部性，一直是全球气象预报中最难攻克的“幽灵”灾害。今日，谷歌宣布通过一种极具创意的方案破解了这一难题:利用大语言模型挖掘新闻报道中的非结构化数据，成功构建了覆盖全球的山洪预测体系...

AI资讯 # 大语言模型 # 山洪暴发 # 山洪预测体系

1周前

070

毁灭性风险！研究发现 AI 在 95% 模拟核危机中倾向选择“核打击”

当人工智能掌握了核武器的“发射按钮”，世界会变得更安全吗？伦敦国王学院教授肯尼斯·佩恩的一项最新研究给出了令人不寒而栗的答案。实验显示，在模拟核危机场景中，大语言模型（LLM）更倾向于升级冲突，甚至在...

AI资讯 # AI新词 # 人工智能 # 大语言模型

1周前

070

杨立昆进军“世界模型”：其 AI 初创公司完成 10.3 亿美元融资

图灵奖得主、Meta 前首席人工智能科学家杨立昆（Yann LeCun）创办的初创公司 Advanced Machine Intelligence (AMI) 周二宣布，已成功筹集 10.3 亿美元 ...

AI资讯 # AI系统 # AMI # 大语言模型

1周前

050

Unsloth Studio 发布：首个本地可视化大模型微调平台，显存占用降低 70%

知名高性能微调库 Unsloth AI 正式推出了 Unsloth Studio。这是一款开源、无代码的本地可视化界面，旨在大幅降低软件工程师微调大语言模型（LLM）的门槛，让开发者彻底告别复杂的 C...

AI资讯 # Triton # UnslothAI # UnslothStudio

1周前

0130

小而强、轻而快！通义千问 Qwen3.5 推出多款小尺寸模型，适配消费级显卡

阿里通义实验室宣布，正式推出其最新一代大语言模型 Qwen3.5的系列小尺寸版本。本次发布的模型涵盖了0.8B、2B、4B 以及9B 四种参数规模，旨在通过极致的性能优化，降低 AI 技术的应用门槛...

AI资讯 # Qwen3.5 # 大语言模型 # 小尺寸版本

1周前

070

xAI发布Grok4.20:推理性能提升显著，不幻觉率78%创行业纪录

2026年3月12日，xAI正式发布新一代大语言模型Grok4.20Beta，该模型在保持价格竞争力的同时，凭借极高的事实可靠性刷新了行业纪录。根据Artificial Analysis的最新评估，G...

AI资讯 # AI新词 # Grok4.20Beta # xAI

1周前

0100

技术优化仍需打磨:Meta 宣布 Llama4发布计划推迟至5月

据知情人士透露，Meta 已决定将其备受期待的新一代大语言模型 Llama4的发布时间至少推迟至今年5月。尽管扎克伯格曾多次表达对该模型的厚望，但研发团队在基础模型的性能微调与逻辑推理优化过程中遇到了...

AI资讯 # AI新词 # Llama4 # Meta

1周前

060

体积减半性能不减!西班牙 Multiverse 靠量子压缩术挑战 OpenAI

针对大语言模型（LLM）体积臃肿、部署成本高昂的痛点，西班牙 AI 初创公司 Multiverse Computing 正在通过独特的“压缩术”打破僵局，试图在企业级 AI 市场与 OpenAI 等巨...

AI资讯 # CompactifAI # HyperNova60B # MultiverseComputing

4周前

070

日本数据科学家推出“零错误”编程语言 Sui，声称让大模型写代码准确率达100%

在大模型生成代码仍饱受语法错误、命名混乱和上下文依赖困扰的当下，日本数据科学家本田崇人（Takato Honda）带来了一套激进的解决方案:一门名为 **Sui**(粋)的全新编程语言。其名称取自日本...

AI资讯 # AI编程 # Sui # 大语言模型

1个月前

0300