Stability AI推出端侧音频生成模型Stable Audio Open Small,号称速度最快

AI资讯1个月前发布 adminps
30 0 0
2025年5月14日,AI初创公司 Stability AI 推出了 Stable Audio Open Small。这是一款号称市场上速度最快的 “立体声” 音频生成AI模型,可在智能手机上运行。以下是关于该模型的详细介绍:
  • 技术优势
    • 运行速度快:能在不到 8 秒的时间内,在手机上生成最长 11 秒的音频片段,适用于快速制作鼓点或乐器片段等音效。
    • 端侧运行:无需依赖云端处理,与芯片制造商 Arm 合作,针对 Arm CPU 特别优化,可以在智能手机上离线运行,提升了运行效率,降低了对网络连接的依赖。
    • 训练数据优质:训练数据全部来自 Free Music Archive 和 Freesound 免版税音频库,避免了知识产权风险,同时为用户提供丰富多样的音频素材。
  • 模型局限性:目前仅支持英文提示,无法生成逼真的人声或高质量歌曲,且由于训练数据偏向西方风格,在不同音乐类型上的表现存在差异。
  • 使用条款:研究人员、爱好者及年收入低于 100 万美元的企业可免费使用,超过这一收入门槛的开发者或组织需购买 Stability AI 的企业许可证。
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...