编辑: hys520855 | 2017-09-22 |
自动输入又分为汉字识别输入及语音识别输入.从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了联机手写体识别.到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段. 模式识别技术已经有所小成,但还远远不够完善,本文就文字识别方面做出一点点贡献,对数学符号的识别技术进行研究,让文字识别技术不再局限于汉字,或者单纯的文字,对一些特殊符号也有能够识别出来. 第2章 模糊识别的相关理论 2.1模糊模式识别相关知识及理论 2.1.1模糊度[1] (1)定义 所谓论语U上的一个模糊子集A的模糊度D(A)是指 ①当且仅当取0和1时,D(A)=0,这时模糊度最小;
②当=0.5时,D(A)=1,这时模糊度最大;
③设任意,而A和是U的两个模糊子集,如果或,则有.其中是对、的隶属度 (2)说明 ①如果一个模糊集合的模糊度为0,则该集合退化为普通集合;
②当隶属度取0.5时,是最模糊的;
③隶属度越接近0.5就越模糊,离0.5越远则越清晰 2.1.2 闵可夫斯基距离[1] 1.闵可夫斯基距离 (3-1) 设论域,是上的两个模糊子集,则之间的闵可夫斯基距离为 2.海明距离 (1)海明距离 在闵可夫斯基距离中,如果=1,这时有 (3-2) 为海明距离. (2)相对海明距离 (3-3) 为相对海明距离 (3)加权海明距离 (3-4) 为加权海明距离.是加到的权.要求=1 (4)相对加权海明距离 (3-5) 为相对加权海明距离.是加到的权.要求 (5)正距离和负距离 将海明加权距离变换成 (3-6) 如果,则称和的距离为正距离;
如果,则称和的距离为负距离. 3.欧氏距离 (1)欧氏距离 在闵可夫斯基距离中,如果=2,这时有 (3-7) 为欧氏距离. (2)相对欧氏距离 (3-8) 为相对欧氏距离. 2.1.3贴近度 (1)贴近度[2]: 贴近度是两个模糊子集间互相靠近的程度,理想的贴近度应当具有以下性质: ① ② ③. 贴近度定义很多, 设A,B为U上的两个模糊子集,可以将它们之间的贴近度定义为: (3-9) (2)海明贴近度[3] (3-10) (3)欧氏贴近度[3] (3-11) 2.1.4 模糊模式识别原则 (1)最大隶属原则[2] 设 是中的个模糊子集, 且对每一均有隶属度函数,为U中的任一元素,若有隶属度函数 则 ①若有了隶属度函数,我们把隶属度函数作为判别函数使用即可. ②此法的关键是求隶属度函数 ③U中的每一个元素,代表了样本的一种取值情况,而代表了不同的类别 (2) 阈值原则[2] 设为n个标准模型,,
取定水平. 若,则判决为:不能识别,应查找原因另作分析. 若存在,使,则判决为:相对地另属于 (3)择近原则 设上有个模糊子集及另一模糊子集.若贴近度 则称与最贴近,则类. ①样本和类都用模糊子集来表示 ②取值范围U中的每个元素代表了一个特征维度 2.2手写文字的识别[3] 对于一个印刷体字母,首先把它局限于一个框框内,然后把这个框框分成很多小方格,在每个小方格上按线条出现的清晰程度给予适当的隶属度,而i,j是该方格所在的行数和列数.这样,可构成一个模糊关系矩阵,约定: ........