快手旗下Kling AI于Omni生态周首日发布2.6版本,首次内置音频生成,支持中英双语对白、歌唱与音效同步输出,实现“文本⇄视频⇄音频”一键闭环。官方口号“See the Sound, Hear the Visual”直指其多模态同步定位。
技术规格方面,2.6保持10秒1080P高清输出,每5秒仅需25积分(较前版降30%)。扩散变换器+3D时空联合注意力架构带来三项提升:复杂指令遵守率提高15%、跨镜头角色一致性达SOTA、对标Seedance1.0盲测胜率285%。
市场层面,Kling2.6将率先在Artlist等专业平台上线,提供场景扩展与多元素编辑API,面向影视、短剧、广告及MV制作。快手表示,2026Q1将推出4K/60fps版本,并开放自定义声线库,继续降低“AI制片”门槛。
行业观察认为,音频同步补齐了AI视频最后一块短板,后期剪辑流程有望缩短50%以上。随着Kling2.6落地,AI创作工具竞争从“画面”延伸至“声音”,有声短视频或迎来新一轮供给爆发。
© 版权声明
本网转发此文章,旨在为读者提供更多信息资讯,只用于分享,不做任何商业用途,版权归原作者所有。由于条件所限,在转载之前无法与所有权利人联系授权,可能出现部分原创图片或文字未署名,请联系添加。如有侵权,请联系删除处理。
相关文章
暂无评论...
