编辑: 棉鞋 | 2013-04-08 |
com 第页1LD3320 评估板说明书 语音识别芯片/声控芯片 单芯片/非特定人/动态编辑识别列表 语音识别解决方案 用声音去沟通 VUI (Voice User Interface) ICRoute 用声音去沟通 VUI (Voice User Interface) Web : www.icroute.com Tel : 021-68546025 Mail: [email protected] [email protected] 第页2一一一
一、 、 、 、语音识别芯片介绍 语音识别芯片介绍 语音识别芯片介绍 语音识别芯片介绍 LD3320 是一颗基于非特定人语音识别(SI-ASR:Speaker-Independent Automatic Speech Recognition)技术的语音识别/声控芯片.提供了真正的单 芯片语音识别解决方案. LD3320 芯片上集成了高精度的 A/D 和D/A 接口,不再需要外接辅助的 Flash 和RAM,即可以实现语音识别/声控/人机对话功能.并且,识别的关键词 语列表是可以动态编辑的. 基于 LD3320,可以在任何的电子产品中,甚至包括最简单的
51 作为主控 芯片的系统中,轻松实现语音识别/声控/人机对话功能.为所有的电子产品增 加VUI(Voice User Interface)语音用户操作界面. 二二二
二、 、 、 、语音识别评估板介绍 语音识别评估板介绍 语音识别评估板介绍 语音识别评估板介绍 语音识别评估板,目的是为了用最简单的方式,向用户展示出 LD3320 芯片 所具有的语音识别功能.该评估板并不具备让用户再二次开发的功能.用户如 果需要根据自己的产品定义来进行具体测试,需要自行用 LD3320 芯片进行开 发. 1. 评估板上集成了 LD3320 用来作语音识别,主控 MCU 选用的是单片机 STC10L08XE.演示的软件程序全部烧录在 MCU 的内置 Flash 中.主控 MCU 直接 控制 LD3320 完成所有和语音识别相关的工作.(主控 MCU 通过读/写LD3320 的 寄存器完成操作.例如在编辑关键词语时,主控 MCU 通过把关键词语的拼音串 设置进 LD3320 相关寄存器来完成编辑) 2. 评估板上另外集成了一片串行存储芯片,是华邦的 W25Q40AVSNIG,大 小为 512Kbyte.里面存储的是演示程序在运行过程中播放的声音素材.格式为 MP3 格式.为了节省存储空间,所有的录音声音都为 8kbps 的MP3,音乐声音也 只是 16Kbps 的MP3(相当于 2Kbyte/秒),所以音效不是最佳.如果客户追求 最佳音效,可以用最高码率的 MP3 以演绎 LD3320 的播放效果. LD3320 芯片外观 [email protected] 第页33. 在电源方面,评估板使用了 NS 公司的 LM1117-3.3 芯片,为LD3320 提供3.3V 的电压.用户应该为评估板提供稳定的电源输入,建议输入电压为 5V 直流电源.由于评估板使用了 LD3320 的内置功放(Speaker 模式)来推动外置 喇叭播放声音,而且目前演示程序设置的播音音量为 12(最大为 15,最小为 0),峰值时会需要有约 300mA 的电流来驱动播放.所以请用户注意提供足够功 率的电源来保证评估板的正常运行.(请注意电源的正负极) 4. 在音频输入和输出方面,评估板配套了一个柱极体 MIC 和一个 0.5W 的 小喇叭.需要说明的是,语音识别的效果和多种因素相关,这些因素也包括外 接麦克风的灵敏性能和信噪比性能.目前随评估板配套的柱极体 MIC 是市面上 最普通的售价大约为 0.3RMB 的MIC.用户如果需要测试,可以自行配置高灵敏 度或者单一指向性的麦克风,接入评估板进行测试.请注意麦克风的极性正 反,如果接反,会导致没有声音输入 LD3320. 5. 在语音识别芯片的音频输入灵敏度的参数设置上,目前评估板设置的参 数相对比较低,也就是对于比较近距离的声音有比较好的识别效果,对于比较 距离远的声音会不灵敏.用户将来在自行开发时,可以自行设置相关参数来调 整性能以满足具体产品的应用场景需求.在评估板上,如果换用高灵敏度的麦 克风,也可以有效地扩大语音识别的作用距离,用户如果有兴趣可以自行测 试.(举例说明,奥林巴斯的 ME52 麦克风就属于高灵敏度的麦克风) 6. 在评估板上MCU 通过并口的方式和LD3320 相连接,晶振是22.1184MHz . LD3320 评估板的照片:[email protected] 第页4三三三