1月29日,昆仑万维(Skywork AI)宣布正式开源其自研的“全能型”视频生成大模型——SkyReels-V3。 该模型的发布标志着视频生成技术进入了高保真、多模态的新阶段,通过单一建模架构实现了参考图像转视频、视频延长以及音频驱动虚拟形象三大核心能力的深度集成。
在**参考图像转视频(I2V)**领域,SkyReels-V3支持1至4张参考图输入,能够精准保留主体身份特征与空间构图。测评数据显示,其在参考一致性与视觉质量指标上均表现出色,超越了 Vidu Q2和 Kling1.6等主流商用模型。

针对视频创作中的时长与叙事痛点,SkyReels-V3推出了强大的视频延长功能。该功能不仅支持简单的视角延续,更引入了“镜头切换延长模式”,内置切入、正反镜头等专业电影转场技术,使 AI 生成视频从简单的“时间扩展”进化为具备逻辑的“叙事扩展”。
此外,**音频驱动虚拟形象(Talking Avatar)**模块通过精准的音视频对齐技术,实现了极高的口型同步率,并支持分钟级长视频生成及多角色交互,为数字人直播和在线教育提供了更自然的交互体验。

目前,SkyReels-V3已在 GitHub 正式开源,并提供限时免费的 API 调用服务。昆仑万维表示,将继续深耕“All in AGI 与 AIGC”战略,通过开源推动 AI 视频创作生态的繁荣。
地址:GitHub:https://github.com/SkyworkAI/SkyReels-V3
© 版权声明
本网转发此文章,旨在为读者提供更多信息资讯,只用于分享,不做任何商业用途,版权归原作者所有。由于条件所限,在转载之前无法与所有权利人联系授权,可能出现部分原创图片或文字未署名,请联系添加。如有侵权,请联系删除处理。
相关文章
暂无评论...
