AI工具集
  • 首页
  • AI资讯
  • AI百科
  • AI教程
  • AI名人
  • 排行榜
  • 今日热点
  • 提交AI工具
      • 未登录
        登录后即可体验更多功能
    • 首页
    • AI名人
    • AI教程
    • AI百科
    • AI资讯
    • 排行榜
    • 工具提交
    未登录
    登录后即可体验更多功能

    强化学习

    共 9 篇文章
    排序
    发布更新浏览点赞
    Cursor 发布 Composer1.5:强化学习规模提升20倍,性能实现跨越式增长

    Cursor 发布 Composer1.5:强化学习规模提升20倍,性能实现跨越式增长

     知名 AI 辅助编程工具开发团队 Cursor 今日正式宣布推出其最新一代智能编码模型——Composer1.5。相比前代产品,新模型在推理深度、响应速度以及处理复杂长任务的能力上...
    AI资讯# AI新词# Composer1.5# Cursor
    1个月前
    0250
    腾讯混元再迎大将:顶级科学家庞天宇加盟,领衔多模态强化学习

    腾讯混元再迎大将:顶级科学家庞天宇加盟,领衔多模态强化学习

    腾讯在 AI 人才版图上持续重仓。 近日,清华大学博士、前新加坡 Sea AI Lab 高级研究科学家庞天宇正式加盟腾讯,出任混元多模态部首席研究科学家。 他将重点负责强化学习技术的研究与突破,助力混...
    AI资讯# AI人才# 强化学习# 混元大模型
    2个月前
    0200
    ​OpenAI 推出 “忏悔” 机制 旨在揭示 AI 潜在不当行为

    ​OpenAI 推出 “忏悔” 机制 旨在揭示 AI 潜在不当行为

    近日,OpenAI 正在测试一种新方法,旨在揭示模型的潜在问题,比如奖励黑客行为或忽视安全规则。这一新机制被称为 “忏悔”,其核心理念是训练模型在单独的报告中承认规则违反,即使原始回答存在欺骗性,仍然...
    AI资讯# OpenAI# 奖励黑客# 强化学习
    1个月前
    0190
    前 DeepMind 首席科学家辞职创业,瞄准超级智能新篇章!

    前 DeepMind 首席科学家辞职创业,瞄准超级智能新篇章!

      前谷歌 DeepMind 的首席科学家、曾在 AlphaGo 项目中发挥关键作用的席尔瓦(David Silver)日前正式辞职,并在伦敦创办了 AI 初创公司...
    AI资讯# AI新词# DeepMind# IneffableIntelligence
    4周前
    0170
    百万级智能体“大练兵”!MiniMax 联手腾讯云:RL 沙箱实现全量平稳运行

    百万级智能体“大练兵”!MiniMax 联手腾讯云:RL 沙箱实现全量平稳运行

    在 AI 智能体(Agent)从实验室走向大规模应用的进程中,底层基建的支撑能力正面临前所未有的考验。近日,MiniMax与 腾讯云 宣布达成深度合作,并成功完成了一次 Agent 基建的重要实践。依...
    AI资讯# Agent# AI智能体# 强化学习
    1周前
    0120
    ​DeepMind 功勋老兵 David Silver 离职创业:押注强化学习,挑战大模型局限性

    ​DeepMind 功勋老兵 David Silver 离职创业:押注强化学习,挑战大模型局限性

    Google DeepMind 的核心开创性人物 David Silver 近日正式宣布离职。作为 AlphaGo、AlphaZero 以及 MuZero 等划时代项目的灵魂人物,他的离去不仅标志着 ...
    AI资讯# AI新词# DeepMind# IneffableIntelligence
    2个月前
    0110
    2.6B参数碾压百亿级巨兽!Liquid AI最新实验性模型LFM2-2.6B-Exp发布

    2.6B参数碾压百亿级巨兽!Liquid AI最新实验性模型LFM2-2.6B-Exp发布

    圣诞节当天,知名边缘AI初创公司Liquid AI正式发布了其最新实验性模型LFM2-2.6B-Exp,这一仅有2.6B(26亿)参数的小型开源模型,在多项关键基准测试中表现出色,尤其在指令跟随能力上...
    AI资讯# AI新词# LFM2-2.6B-Exp# LiquidAI
    2个月前
    070
    ​世界模型迈入精细调优时代:腾讯开源强化学习后训练框架 WorldCompass

    ​世界模型迈入精细调优时代:腾讯开源强化学习后训练框架 WorldCompass

     腾讯混元3D 团队昨日宣布,正式开源业界首个面向世界模型的强化学习(RL)后训练框架——WorldCompass。作为混元世界模型1.5的官方强化学习扩展模块,该框架旨在显著提升世...
    AI资讯# WorldCompass# 世界模型# 强化学习
    1周前
    060
    OpenClaw能“边用边训”了:智能体强化学习训练框架AReaL v1.0稳定版发布

    OpenClaw能“边用边训”了:智能体强化学习训练框架AReaL v1.0稳定版发布

    3月4 日,蚂蚁集团联合清华大学发布开源强化学习训练框架 AReaL v1.0稳定版。该版本主打“Agent 一键接入 RL 训练”:不用改代码,兼容各类 Agen...
    AI资讯# Agent# AReaL# 强化学习
    1周前
    050
    没有了
    AI工具集
    AI工具集(aitools.cc)专注聚合全球优质AI人工智能工具导航站,涵盖AI写作、文本生成、图片生成、视频处理、代码开发、语音识别等10+领域精选AI应用推荐,每日更新AI工具评测与使用攻略。立即探索1000+款免费与付费AI工具,快速匹配您的需求!

    友链申请 免责声明 关于我们 联系我们 联系删除 工具提交

    扫码加QQ群AI工具集
    扫码加QQ群
    扫码加微信AI工具集
    扫码加微信
    Copyright © 2026 AI工具集 沪ICP备2025121622号 由 OneNav 强力驱动 
    网址
    网址文章软件书籍