OpenAI 语音 API 大进化：数字转录更精准，代理速度狂飙 40%

AI资讯4周前发布 adminps

OpenAI 近日面向全球开发者推出了两项关键 API 更新，旨在大幅提升 AI 智能体在语音交互与复杂任务流中的性能表现。

在模型层面，全新的实时模型 gpt-realtime-1.5 及其配套音频模型正式登场，其核心目标是提高语音命令的可靠性。根据 OpenAI 内部测试数据，新模型在处理数字和字母的转录准确率上提升了约 10%，逻辑音频任务准确率提高了 5%，而指令执行的准确率也相应提升了 7%，有效解决了 AI 在听取关键短语或执行复杂语音指令时的偏差问题。

OpenAI

在架构层面，Responses API 现已支持 WebSocket 协议，这标志着 AI 通信模式的重大变革。与以往每次请求都必须重新传输完整上下文的模式不同，WebSocket 允许开发者建立持久连接，系统仅在产生新数据时进行增量发送。

OpenAI 指出，这一改进对于需要频繁调用大量工具的复杂 AI 代理尤为关键，能够将其运行速度直接提升 20% 到40%。这两项更新不仅让 AI 的“听力”更敏锐，更让其“行动”效率迈向了全新的台阶。

AI资讯 # API更新 # gpt-realtime-1.5 # OpenAI # 语音交互

© 版权声明

本网转发此文章，旨在为读者提供更多信息资讯，只用于分享，不做任何商业用途，版权归原作者所有。由于条件所限，在转载之前无法与所有权利人联系授权，可能出现部分原创图片或文字未署名，请联系添加。如有侵权，请联系删除处理。

相关文章

豪掷 5 亿美金后又投千万！昆仑万维领跑海外AI短剧， 8000 万月活背后的“掘金术”

豪掷 5 亿美金后又投千万！昆仑万维领跑海外AI短剧， 8000 万月活背后的“掘金术”

AI资讯 # AI短剧 # DramaWave # FreeReels

1个月前

0210

Telegram彻底开放！Bot API 9.5重磅更新：所有类型聊天机器人全面支持流式传输，OpenClaw率先完美适配

Telegram彻底开放！Bot API 9.5重磅更新：所有类型聊天机器人全面支持流式传输，OpenClaw率先完美适配

AI资讯 # BotAPI # OpenClaw # Telegram

1周前

070

谷歌 Gemini 新功能上线！让你快速获取答案，告别漫长思考

谷歌 Gemini 新功能上线！让你快速获取答案，告别漫长思考

AI资讯 # AI新词 # Gemini # 品牌产品词

1个月前

060

Lima v2.0 重磅发布：从容器利器进化为安全 AI 工作流的“隐形盾牌”

Lima v2.0 重磅发布：从容器利器进化为安全 AI 工作流的“隐形盾牌”

AI资讯 # AI编码代理 # GPU加速 # Limav2.0

1个月前

0180

暂无评论

您必须登录才能参与评论！

立即登录

none

暂无评论...

AI工具集

一站式人工智能工具导航站 - AITools官网精选AI应用推荐与评测

加入收藏夹

按 Ctrl+D 可收藏本网页，方便快速打开使用。

设为首页

浏览器 设置页面 > 启动时 选项下 打开特定网页或一组网页。

852

收录网址

3.1K

收录文章

1

收录软件

0

收录书籍