编辑: 棉鞋 | 2019-07-05 |
com 第页1LD3320 语音识别芯片 (单芯片/非特定人/动态编辑识别列表 语音识别解决方案) 用声音去沟通 VUI (Voice User Interface) ICRoute 用声音去沟通 VUI (Voice User Interface) Web : www.icroute.com Tel : 021-68546025 Mail: [email protected] [email protected] 第页2一一一
一、 、 、 、. . . . 语音识别芯片介绍 语音识别芯片介绍 语音识别芯片介绍 语音识别芯片介绍 LD3320 是一颗基于非特定人语音识别(SI-ASR:Speaker-Independent Automatic Speech Recognition)技术的语音识别/声控芯片.提供了真正的单 芯片语音识别解决方案. LD3320 芯片上集成了高精度的 A/D 和D/A 接口,不再需要外接辅助的 Flash 和RAM,即可以实现语音识别/声控/人机对话功能.并且,识别的关键词 语列表是可以动态编辑的. 基于 LD3320,可以在任何的电子产品中,甚至包括最简单的
51 作为主控 芯片的系统中,轻松实现语音识别/声控/人机对话功能.为所有的电子产品增 加VUI(Voice User Interface)语音用户操作界面. 主要特色功能: 非特定人语音识别技术 非特定人语音识别技术 非特定人语音识别技术 非特定人语音识别技术: : : :不需要用户进行录音训练 可动态编辑的识别关键词语列表 可动态编辑的识别关键词语列表 可动态编辑的识别关键词语列表 可动态编辑的识别关键词语列表: : : :只需要把识别的关键词语以字符串的形式传 送进芯片,即可以在下次识别中立即生效.比如,用户在
51 等MCU 的编程中, 简单地通过设置芯片的寄存器,把诸如"你好"这样的识别关键词的内容动态 地传入芯片中,芯片就可以识别这样设定的关键词语了. 真正单芯片解决方案 真正单芯片解决方案 真正单芯片解决方案 真正单芯片解决方案: : : :不需要任何外接的辅助 Flash 和RAM,真正降低系统成 本. 内置高精度 内置高精度 内置高精度 内置高精度 A/D A/D A/D A/D 和和和和D/A D/A D/A D/A 通道 通道 通道 通道: : : :不需要外接 AD 芯片,只需要把麦克风接在芯片的 AD 引脚上;
可以播放声音文件,并提供 550mW 的内置放大器. 高准确度和实用的语音识别效果 高准确度和实用的语音识别效果 高准确度和实用的语音识别效果 高准确度和实用的语音识别效果 支持用户自由编辑 支持用户自由编辑 支持用户自由编辑 支持用户自由编辑
50 50
50 50 条关键词语 条关键词语 条关键词语 条关键词语 在同一时刻,最多在
50 条关键词语中进行识 别,终端用户可以根据场景需要,随时编辑和更新这
50 条关键词语的内容. LD3320 芯片外观 [email protected] 第页3二二二
二、 、 、 、语音识别介绍 语音识别介绍 语音识别介绍 语音识别介绍 语音识别 ASR 技术,是基于关键词语列表识别的技术.只需要设定好要识 别的关键词语列表,并把这些关键词语以字符的形式传送到 LD3320 内部,就可 以对用户说出的关键词语进行识别.不需要用户作任何地录音训练. 语音识别 ASR 现实意义: ASR 技术最重要的现实意义就在于提供了一种脱离按键,键盘,鼠标的基 于语音的用户界面 VUI:Voice User Interface. 使得用户对于产品的操作更快速,更自然. 非特定人语音识别技术 ASR,是对几十 G 的语音数据经语言学家语音模型 分析,科学家建立数学模型,并经过反复训练提取基元语音的细节特征,以及 提取各基元间的特征差异.可以得到在统计概率最优化意义上的各个基元语音 特征.最后才由资深工程师将算法以及语音模型转化为硬件芯片以应用在嵌入 式系统中. 基于领先的语音识别核心引擎,经过在各大主流手机产品中三年来超过一 千万份的量产检验,LD3320 提供了可以真正实用的语音识别/声控功能. ASR 技术是基于关键词语列表识别的技术. 每次识别的过程,就是把用户说出的语音内容,通过频谱转换为语音特 征,和这个关键词语列表中的条目进行一一匹配,最优匹配的一条作为识别结 果.比如在手机的应用中,这个关键词语列表的内容就是电话本中的人名/手机 的菜单命令/T 卡中的歌曲名字. 不论这个列表的条目内容是什么,只需要用户设置相关的寄存器,就可以 把相应的待识别条目内容以字符形式传递给识别引擎. LD3320 可以识别列表中的关键词,用户说的语音可以是这个列表中任意的 关键词语,而且不需要用户在识别前进行任何训练. 识别引擎不关心关键词语列表中的关键词语的内容,可以是命令,人名, 歌曲名字,操作指令等等任何的汉字字符串. 每条关键词语最大可以支持的字数,从算法角度是限制在