【PDF】语音交互服务 - 资源下载

编辑：

xwl西瓜xym

2019-05-24

帮助客户减少人力成本,节省业务支出. 实时语音转写实时语音转写服务,用户通过实时访问和调用API获取实时语音转写结果. RASR优势 l 识别准确率采用最新一代语音识别技术,基于DNN(深层神经网络)技术,大大提高了抗噪性能,使识别准确率显著提升. l 识别速度快把语言模型,词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升解码速度,使识别速度在业内处领先地位. l 多种识别模式支持多种实时语音转写模式,如流式识别、连续识别和实时识别模式,灵活适应不同应用场景. l 定制化服务可定制特定垂直领域的语言层模型,可识别更多专有词汇和行业术语,进一步提高识别准确率. RASR功能 l 文本时间戳为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频. l 智能断句通过提取上下文相关语义特征,并结合语音特征,智能划分断句及添加标点符号,提升输出文本的可阅读性. l 中英文混合识别支持在中文句子识别中可夹带英文字母、数字等,从而实现中、英文以及数字的混合识别. l 支持多种方言、语种具备粤语、四川话、闽南话等多种方言及蒙古语、藏语、维语等少数民族语言的识别能力,能够覆盖绝大多数带方言口音的普通话识别场景. l 即时输出识别结果连续识别语音流内容,即时输出结果,并可根据上下文语言模型自动校正. 语音交互服务产品介绍

1 什么是语音交互服务文档版本

2 l 自动静音检测对输入语音流进行静音检测,识别效率和准确率更高. l 接入方式灵活支持WebSocket和MRCP接口. 语音交互服务产品介绍

1 什么是语音交互服务文档版本

3 2应用场景语音识别的应用场景语音识别的应用场景如表2-1所示. 表2-1 语音识别的应用场景应用场景详细描述智能客服集成语音识别的智能客服系统,可以自动识别客户的语音和语义,然后自动以语音形式回复客户.减少人力成本,保证服务质量. 图2-1 智能客服场景语音交互服务产品介绍

2 应用场景文档版本

4 应用场景详细描述智能会议集成语音识别的智能会议系统,可以自动识别参会人员的声纹、语音,通过实时、准确的识别,达到实时弹幕显示、会议记录等. 图2-2 智能会议场景直播字幕在视频直播场景中,将音频实时转写成文本字幕,与视频一起播出,提升观众友好性.结合敏感关键词检测服务,进行质检审查. 图2-3 直播字幕场景语音交互服务产品介绍

2 应用场景文档版本

5 应用场景详细描述人机交互通过语音唤醒、语音识别服务,对终端设备发送语音命令,对设备进行实时操作,提升人机交互体验. 图2-4 人机交互场景语音合成的应用场景语音合成的应用场景如表2-2所示. 语音交互服务产品介绍

2 应用场景文档版本

6 表2-2 语音合成的应用场景应用场景详细描述语音导航使用语音合成服务将车载导航数据转换成语音素材,为用户提供精确的语音导航服务.利用个性化定制能力,提供丰富的导航语音服务. 图2-5 语音导航场景有声读物将书籍、杂志、新闻的文本内容转换成逼真的人声发音,充分解放人们的眼睛,在搭乘地铁、开车、健身等场景下获取信息、享受乐趣. 图2-6 有声读物场景语音交互服务产品介绍

注：以上内容是本站开源项目的机器提供的预览内容，更完整和更好的阅读体验请直接免费下载资源后阅读

下载（注：源文件不在本站服务器，都将跳转到源网站下载）

备用下载

下一篇: INTERNATIONAL BUYER PROGRAMME
上一篇: Lexis® China 律商网公司法实务

PDF《语音交互服务》