【PDF】语音交互服务 - 资源下载

编辑：

xwl西瓜xym

2019-05-24

语音交互服务产品介绍文档版本

保留一切权利. 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播. 商标声明和其他华为商标均为华为技术有限公司的商标. 本文档提及的其他所有商标或注册商标,由各自的所有人拥有. 注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内.除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证. 由于产品版本升级或其他原因,本文档内容会不定期进行更新.除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保. 华为技术有限公司地址: 深圳市龙岗区坂田华为总部办公楼邮编:518129

网址: http://e.huawei.com 文档版本

2 应用场景.4

3 如何开通和使用服务.10

4 与其他云服务的关系.11

5 约束限制.13 5.1 语音识别.13 5.2 语音合成.13 5.3 实时语音转写.14 A 修订记录.15 语音交互服务产品介绍目录文档版本

01 (2019-03-30) 版权所有 ? 华为技术有限公司 ii 1什么是语音交互服务语音交互是一种人机交互方式,以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取语音交互结果. 语音交互包括三个子服务: l 语音识别(Automatic Speech Recognition,ASR):将口述音频转换为文本. l 语音合成(Text To Speech,TTS):是一种将文本转换成逼真语音的服务. l 实时语音转写(Real-time ASR,RASR):将连续的音频流实时转换成文本,语音识别更快. 语音识别当前语音识别提供了短语音识别和长语音识别功能,短语音识别对时长较短的语音识别速度更快,长语音识别对时长较长的录音文件转写效果更好. l 短语音识别服务:可以实现1分钟以内、不超过4MB的音频到文字的转换.对于用户上传的完整的录音文件,系统通过处理,生成语音对应文字内容. l 长语音识别服务:可以实现4小时以内的音频到文字的转换.对于用户上传的完整的录音文件,系统通过处理,生成语音对应文字内容. ASR优势 l 效果出众使用深度学习技术,语音识别准确率超过95%. l 广泛支持支持中文普通话的语音识别,满足多种场景下的应用需求. l 稳定可靠成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验. l 简单高效提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;

帮助客户减少人力成本,节省业务支出. 语音合成语音合成将用户输入的文字合成为音频.通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务. 语音交互服务产品介绍

1 什么是语音交互服务文档版本

1 TTS优势 l 效果出众使用深度学习技术来合成逼真的人声语音,合成速度快,语音自然流畅. l 个性定制能够对合成后的语音音色、音调、语速进行个性化的设置,满足客户的定制化需求. l 稳定可靠成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验. l 简单高效提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;

注：以上内容是本站开源项目的机器提供的预览内容，更完整和更好的阅读体验请直接免费下载资源后阅读

下载（注：源文件不在本站服务器，都将跳转到源网站下载）

备用下载

下一篇: INTERNATIONAL BUYER PROGRAMME
上一篇: Lexis® China 律商网公司法实务

PDF《语音交互服务》