• 最新
晴数智慧多语种高质量口语式语音数据集驱动Voice Agent交互更丝滑|

美东时间3月20日,OpenAI举行了一场重磅的技术直播,发布了三款全新语音模型:语音转文本模型GPT-4o Transcribe和GPT-4o MiniTranscribe,以及文本转语音模型GPT-4o MiniTTS。OpenAI声称,这些模型符合其更广泛的“AI智能体...

声网、RTE开发者社区共同支持两款新模型开源,让Voice Agent 对话更拟人

TEN Turn Detection:让 Voice Agent 学会“何时说、何时听” TEN Turn Detection 重在解决人机对话中最难的部分之一—判断用户何时停止说话。在真实交流中,AI 需要区分出“中途停顿”与“说完了”的差别。插话太早会打断人类...

被动语态(Passive Voice)是让表达更自然的秘密武器!

被动语态(Passive Voice)是让表达更自然的秘密武器!来源:赢哥的英语小天地 发表时间:2025/05/16 12:00:00

Auribus 发布 Voice—集成 AI 的 DAW 声乐平台_人声_声音_工具

Auribus公司宣布推出Voice by Auribus,这是一款集成于数字音频工作站(DAW)的人声平台,该平台基于真实歌手的声音构建,这些歌手通过人工智能技术获得授权、补偿以及声音增强。以下是详细信息… 该工具主要针对音乐制作人、...

谷歌voice最新版2025

谷歌voice最新版2025v2025.05.11.757514662手机版 googlevoice最新版下载安装,提供给你这款免费的语音通话类软件,专为需要手机语音通话软件的用户打造,软件操作使用简单,更多的智能化功能辅助,免费拨打电话和发短信操作...

三星 One UI 8 版 Voice Recorder 曝光:界面聚焦录音和播放

IT之家5月20日消息,科技媒体sammyguru今天(5月20日)发布博文,报道称三星将在OneUI8系统中,更新VoiceRecorder应用,界面重新聚焦录音和播放功能,而转录和翻译等AI工具被整合到次要位置。VoiceRecorder应用此前版本中,...

声网开源TEN VAD与Turn Detection,赋能Voice Agent对话更自然流畅

该模型通过分析语言模式,判断说话者的状态,从而智能决定AI是“说”还是“听”,支持中英文,可供所有Voice Agent开发者使用。在多场景测试数据集上,TEN Turn Detection与其他同类开源模型相比,表现出了优越的性能。当TEN ...

三星One UI 8版Voice Recorder重塑界面:AI功能回归幕后

近日,科技媒体sammyguru报道了三星将在其One UI 8系统中推出全新更新的Voice Recorder应用,令人关注的是,此次更新将界面设计的重心重新聚焦于录音和播放功能,而将AI工具如转录和翻译等功能转移至次要位置。随着用户需求的...

TEN VAD 与 Turn Detection开源,让Voice Agent 对话更拟人

TEN Turn Detection:让 Voice Agent 学会“何时说、何时听” TEN Turn Detection 重在解决人机对话中最难的部分之一—判断用户何时停止说话。在真实交流中,AI 需要区分出“中途停顿”与“说完了”的差别。插话太早会打断人类...

声网开源TENVAD与TENTurnDetection,提升Voice Agent对话流畅性

这两款模型是声网基于其十余年的实时语音技术积累而打造的,旨在为AI语音代理(Voice Agent)带来更佳的交互体验。首先,我们来看看TENVAD(语音活动检测模型)。作为一款轻量级、高性能的模型,TENVAD以其超低延迟、低功耗和...

相关阅读