Grok 也能“开口说话”了!马斯克 xAI 上线语音 API:AI 嘴替争霸战再次升级 在 AI 圈,马斯克的速度总是让人猝不及防。当地时间3月16日,马斯克旗下人工智能初创公司 xAI 在社交平台官宣:其大模型 Grok 的文本转语音(TTS)API 现已正式上线。这意味着,开发者们现... AI资讯# AI新词# Grok# xAI 1周前050
Hume AI开源TADA:5倍速零幻觉TTS,能在手机上跑700秒长音频 Hume AI近日开源发布了其最新语音生成模型TADA(Text-Acoustic Dual Alignment),这是一款基于大语言模型的文本转语音(TTS)系统,采用创新的文本-声学双对齐架构,显... AI资讯# AI新词# HumeAI# TADA 1周前050
真正的情感自由!Fish Audio发布S2:多说话人、词级情绪控制、完全开源 Fish Audio 正式发布新一代文本转语音(TTS)模型 S2,标志着开源TTS技术在表现力和可控性上迎来重大突破。这款名为 Fish Audio S2的模型主打超强情感可控性,用户可通过自然语言... AI资讯# FishAudioS2# TTS模型# 情感可控性 1周前0140
马斯克 xAI 上线语音 API:AI 嘴替争霸战再次升级 在 AI 领域,马斯克的步伐从来不甘于人后。据最新报道,马斯克旗下的 AI 公司 xAI 宣布,Grok 的文本转语音 Speech API 正式上线。这意味着Grok不再仅仅是屏幕上的文字,而是正式... AI资讯# AI新词# Grok# xAI 1周前080
微软开源实时语音模型VibeVoice-Realtime-0.5B,300ms实时开声,90分钟长音频都不喘! 微软悄然开源了一枚“黑马级”实时语音模型:VibeVoice-Realtime-0.5B。这可能是目前全球延迟最低、表现最接近真人的开源文本转语音(TTS)模型之一,话还没说完,声音就已经开始了!&a... AI资讯# VibeVoice-Realtime-0.5B# 开源# 微软 1个月前0150
拒绝高价订阅!Resemble AI 全面开源旗舰级 TTS 模型,自带防伪水印剑指商业应用 人工智能语音领域迎来强力竞争者,初创公司 Resemble AI 正式发布了名为“Chatterbox Turbo”的开源文本转语音模型,其矛头直指 ElevenLabs 和 Cartesia 等行业... AI资讯# ChatterboxTurbo# ResembleAI# 人工智能 1个月前0120
苹果发布PCG语音生成技术:告别刻板校验,AI配音提速40% 针对AI语音合成领域长期存在的效率瓶颈,苹果公司近日联手特拉维夫大学发表了一项名为“原则性粗粒度”(PCG)的创新研究。这项技术通过改变AI对声音预测的验证方式,成功实现了在保证音... AI资讯# AI语音合成# PCG技术# 文本转语音 1个月前0120