编辑: xiaoshou | 2018-01-11 |
2 公司荣誉 ? 国家863计划成果产业化基地 ? 国家规划布局内重点软件企业 ? 国家火炬计划重点高新技术企业 ? 国家高技术产业化示范工程基地 ? 国家级优秀软件企业 ? 中国电子政务IT100强企业 ? 中国中文语音交互技术标准工作组组长 ? 国家博士后科研工作站 InterPhonic 6.5语音合成系统产品白皮书
3 2 产品简介 2.1 系统概述 语音合成(Text-To- Speech),又称为文语转化,是将文本信息转化为语音数据的技术,涉及声学、语言学、 数字信号处理、多媒体等多种前沿的高新科技,是中文信息处理领域的一项前沿技术.语 音合成技术的原理示意如下: 图一:语音合成技术原理示意图 可以从图中看到,语音合成系统的合成引擎在完成文本到语音数据的转化过程中可以 简单分解为两个步骤的处理.文本先经过前端的语法分析,通过科大讯飞公司精心制作的 词典和规则的处理,得到格式规范,携带语法层次的信息,传送到后端.后端在前端分析 的结果基础上,经过韵律方面的分析处理,得到语音的时长、音高等韵律信息,再根据这 些信息在音库中挑选最合适的语音单元,语音单元再经过调整和拼接,就能得到最终的语 音数据. 在整个转化处理的过程中牵涉到大量的中英文语法和韵律知识的运用,以及语法和语 义分析的算法,最佳路径搜索,单元挑选和调整的算法,语音数据编码方面的知识.语音 合成技术涵盖了语音文字的社会科学、数字信号处理等自然科学,是跨学科的高新技术. InterPhonic语音合成系统是由安徽科大讯飞信息科技股份有限公司自主研发的中英文 语音合成系统,主要面向行业级语音信息服务等应用,将文本信息动态实时地转换到流畅 自然的语音数据. InterPhonic 6.5语音合成系统以先进的大语料和TrainableTTS这两种语音合成技术为基础,能提供可比 拟真人发音的高自然度、高流畅性、面向任意文本篇章的连续合成语音合成系统.InterPh InterPhonic 6.5语音合成系统产品白皮书
4 onic 6.5语音合成系统致力于建立和改善人― 机语音界面,为大容量语音服务提供高效稳定的语音合成功能,并提供从电信级、企业级 到桌面级的全套应用解决方案,是新概念声讯服务、语音网站、多媒体办公教学的核心动 力. 本文档针对希望了解InterPhonic 6.5语音合成系统的详细功能和性能特性的客户,详细阐述了InterPhonic产品的各项指标. 通过本文,读者能够了解到世界顶尖级语音合成系统的整体功能,理解语音合成系统的概 念和重要特性. 2.2 包含组件 InterPhonic 6.5语音合成系统是科大讯飞在长期收集客户需求和反馈的基础上,充分考虑集成开发和实 际使用,面向大规模语音应用开发的产品.这套产品从功能上可以分成如下的组件: ? 语音合成引擎:提供语音合成功能的核心功能,包括了合成需要的各种资源文件 、配置和应用程序如:资源管理中心和合成效果演示程序等;
? 开发接口:包括QuickTTS开发接口,TTS COM接口,SAPI接口、iFlyTTS等便于集成开发开发的接口封装,提供提示音和 背景音资源管理接口及其开发文档和示例程序;
? 语音合成工具包:多种语音合成应用工具的集合. 2.3 支持音库 InterPhonic 6.5语音合成系统允许同时安装不同发音人、不同声音数据采样率的多种音库.系统当前支 持的部分音库列表如下: 发音人 支持语种 支持采样率 小琪 中文及中英混读 8k/16k 小燕 中文及中英混读 8k/16k 小美 粤语及粤英混读 8k/16k 宇峰 中文、中英混读及英文 8k/16k 小倩 中文及中英混读 8k/16k Henry 纯英文男声 8k/16k InterPhonic 6.5语音合成系统产品白皮书