编辑: xwl西瓜xym | 2019-05-24 |
01 发布日期 2019-03-30 华为技术有限公司 版权所有 ? 华为技术有限公司 2019.
保留一切权利. 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传 播. 商标声明 和其他华为商标均为华为技术有限公司的商标. 本文档提及的其他所有商标或注册商标,由各自的所有人拥有. 注意 您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或 特性可能不在您的购买或使用范围之内.除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声 明或保证. 由于产品版本升级或其他原因,本文档内容会不定期进行更新.除非另有约定,本文档仅作为使用指导,本文 档中的所有陈述、信息和建议不构成任何明示或暗示的担保. 华为技术有限公司 地址: 深圳市龙岗区坂田华为总部办公楼 邮编:518129
网址: http://e.huawei.com 文档版本
01 (2019-03-30) 版权所有 ? 华为技术有限公司 i 目录1什么是语音交互服务.1
2 应用场景.4
3 如何开通和使用服务.10
4 与其他云服务的关系.11
5 约束限制.13 5.1 语音识别.13 5.2 语音合成.13 5.3 实时语音转写.14 A 修订记录.15 语音交互服务 产品介绍 目录文档版本
01 (2019-03-30) 版权所有 ? 华为技术有限公司 ii 1什么是语音交互服务 语音交互是一种人机交互方式,以开放API(Application Programming Interface,应用 程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取语音交互结果. 语音交互包括三个子服务: l 语音识别(Automatic Speech Recognition,ASR):将口述音频转换为文本. l 语音合成(Text To Speech,TTS):是一种将文本转换成逼真语音的服务. l 实时语音转写(Real-time ASR,RASR):将连续的音频流实时转换成文本,语音 识别更快. 语音识别 当前语音识别提供了短语音识别和长语音识别功能,短语音识别对时长较短的语音识 别速度更快,长语音识别对时长较长的录音文件转写效果更好. l 短语音识别服务:可以实现1分钟以内、不超过4MB的音频到文字的转换.对于用 户上传的完整的录音文件,系统通过处理,生成语音对应文字内容. l 长语音识别服务:可以实现4小时以内的音频到文字的转换.对于用户上传的完整 的录音文件,系统通过处理,生成语音对应文字内容. ASR优势 l 效果出众 使用深度学习技术,语音识别准确率超过95%. l 广泛支持 支持中文普通话的语音识别,满足多种场景下的应用需求. l 稳定可靠 成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验. l 简单高效 提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;
帮助客户减 少人力成本,节省业务支出. 语音合成 语音合成将用户输入的文字合成为音频.通过音色选择、自定义音量、语速,为企业 和个人提供个性化的发音服务. 语音交互服务 产品介绍
1 什么是语音交互服务 文档版本
01 (2019-03-30) 版权所有 ? 华为技术有限公司
1 TTS优势 l 效果出众 使用深度学习技术来合成逼真的人声语音,合成速度快,语音自然流畅. l 个性定制 能够对合成后的语音音色、音调、语速进行个性化的设置,满足客户的定制化需 求. l 稳定可靠 成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验. l 简单高效 提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;