编辑: xwl西瓜xym | 2019-05-24 |
帮助客户减 少人力成本,节省业务支出. 实时语音转写 实时语音转写服务,用户通过实时访问和调用API获取实时语音转写结果. RASR优势 l 识别准确率 采用最新一代语音识别技术,基于DNN(深层神经网络)技术,大大提高了抗噪 性能,使识别准确率显著提升. l 识别速度快 把语言模型,词典和声学模型统一集成为一个大的神经网络,同时在工程上进行 了大量的优化,大幅提升解码速度,使识别速度在业内处领先地位. l 多种识别模式 支持多种实时语音转写模式,如流式识别、连续识别和实时识别模式,灵活适应 不同应用场景. l 定制化服务 可定制特定垂直领域的语言层模型,可识别更多专有词汇和行业术语,进一步提 高识别准确率. RASR功能 l 文本时间戳 为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始 音频. l 智能断句 通过提取上下文相关语义特征,并结合语音特征,智能划分断句及添加标点符 号,提升输出文本的可阅读性. l 中英文混合识别 支持在中文句子识别中可夹带英文字母、数字等,从而实现中、英文以及数字的 混合识别. l 支持多种方言、语种 具备粤语、四川话、闽南话等多种方言及蒙古语、藏语、维语等少数民族语言的 识别能力,能够覆盖绝大多数带方言口音的普通话识别场景. l 即时输出识别结果 连续识别语音流内容,即时输出结果,并可根据上下文语言模型自动校正. 语音交互服务 产品介绍
1 什么是语音交互服务 文档版本
01 (2019-03-30) 版权所有 ? 华为技术有限公司
2 l 自动静音检测 对输入语音流进行静音检测,识别效率和准确率更高. l 接入方式灵活 支持WebSocket和MRCP接口. 语音交互服务 产品介绍
1 什么是语音交互服务 文档版本
01 (2019-03-30) 版权所有 ? 华为技术有限公司
3 2应用场景 语音识别的应用场景 语音识别的应用场景如表2-1所示. 表2-1 语音识别的应用场景 应用场景 详细描述 智能客服 集成语音识别的智能客服系统,可以自动识别客户的语音和语 义,然后自动以语音形式回复客户.减少人力成本,保证服务质 量. 图2-1 智能客服场景 语音交互服务 产品介绍
2 应用场景 文档版本
01 (2019-03-30) 版权所有 ? 华为技术有限公司
4 应用场景 详细描述 智能会议 集成语音识别的智能会议系统,可以自动识别参会人员的声纹、 语音,通过实时、准确的识别,达到实时弹幕显示、会议记录 等. 图2-2 智能会议场景 直播字幕 在视频直播场景中,将音频实时转写成文本字幕,与视频一起播 出,提升观众友好性.结合敏感关键词检测服务,进行质检审 查. 图2-3 直播字幕场景 语音交互服务 产品介绍
2 应用场景 文档版本
01 (2019-03-30) 版权所有 ? 华为技术有限公司
5 应用场景 详细描述 人机交互 通过语音唤醒、语音识别服务,对终端设备发送语音命令,对设 备进行实时操作,提升人机交互体验. 图2-4 人机交互场景 语音合成的应用场景 语音合成的应用场景如表2-2所示. 语音交互服务 产品介绍
2 应用场景 文档版本
01 (2019-03-30) 版权所有 ? 华为技术有限公司
6 表2-2 语音合成的应用场景 应用场景 详细描述 语音导航 使用语音合成服务将车载导航数据转换成语音素材,为用户提供 精确的语音导航服务.利用个性化定制能力,提供丰富的导航语 音服务. 图2-5 语音导航场景 有声读物 将书籍、杂志、新闻的文本内容转换成逼真的人声发音,充分解 放人们的眼睛,在搭乘地铁、开车、健身等场景下获取信息、享 受乐趣. 图2-6 有声读物场景 语音交互服务 产品介绍