2025年5月14日,AI初创公司 Stability AI 推出了 Stable Audio Open Small。这是一款号称市场上速度最快的 “立体声” 音频生成AI
模型,可在智能手机上运行。以下是关于该模型的详细介绍:
- 技术优势:
- 运行速度快:能在不到 8 秒的时间内,在手机上生成最长 11 秒的音频片段,适用于快速制作鼓点或乐器片段等音效。
- 端侧运行:无需依赖云端处理,与芯片制造商 Arm 合作,针对 Arm CPU 特别优化,可以在智能手机上离线运行,提升了运行效率,降低了对网络连接的依赖。
- 训练数据优质:训练数据全部来自 Free Music Archive 和 Freesound 免版税音频库,避免了知识产权风险,同时为用户提供丰富多样的音频素材。
- 模型局限性:目前仅支持英文提示,无法生成逼真的人声或高质量歌曲,且由于训练数据偏向西方风格,在不同音乐类型上的表现存在差异。
- 使用条款:研究人员、爱好者及年收入低于 100 万美元的企业可免费使用,超过这一收入门槛的开发者或组织需购买 Stability AI 的企业许可证。
© 版权声明
本网转发此文章,旨在为读者提供更多信息资讯,只用于分享,不做任何商业用途,版权归原作者所有。由于条件所限,在转载之前无法与所有权利人联系授权,可能出现部分原创图片或文字未署名,请联系添加。如有侵权,请联系删除处理。