世界模型迈入精细调优时代:腾讯开源强化学习后训练框架 WorldCompass 腾讯混元3D 团队昨日宣布,正式开源业界首个面向世界模型的强化学习(RL)后训练框架——WorldCompass。作为混元世界模型1.5的官方强化学习扩展模块,该框架旨在显著提升世... AI资讯# WorldCompass# 世界模型# 强化学习 1周前060