编辑: hys520855 | 2017-09-22 |
本人郑重声明除文中已明确注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容.论文为本人亲自撰写,没有从他人文献中抄袭的现象.本人完全意识到本声明意味着本人毕业论文的原创性,如经查证有抄袭事实,同意承担由此导致的一切后果. 本人签名: 年月日摘要众所周知, 模糊模式识别是经典模式识别方法的延伸,它具有明显的层次特点.模糊模式识别在实际问题中应用非常广泛.本文利用模糊模式识别方法,研究数学符号的模糊识别问题,具体思想为通过C语言来读取目标符号,生成标准点阵库,用Java语言实现模糊识别系统的可视化界面,通过海明贴近度计算出输入字符的点阵和标准点阵库的近似度,并输出识别结果. 本文分为三章.
第一章主要介绍了模糊数学的产生背景、研究内容以及发展前景,还有本文的选题意义.
第二章主要介绍了模糊识别的一些基本理论知识,包括模糊识别中最常用的贴近度和折近原则方法,并例举了一个手写体的汉字识别方法.
第三章才是本文的核心,主要介绍了数学符号的模糊识别的实现:用户通过在画板上手写输入数学符号,由二值化程序实现对输入符号的0 1矩阵化,形成一个16*16的二维矩阵,并与标准点阵库中的每个矩阵进行海明贴近度的计算,输出贴近度最大的那个符号.最后, 还对不同识别方法作了比较. 关键词: 模糊识别;
数学符号;
贴近度;
矩阵化;
标准点阵库 Abstract This thesis'
s focus is on the fuzzy pattern recognition of mathematical symbols, we get the objectives symbols and generate standard lattice library by C language, and accomplish the visual interface of fuzzy recognition system with Java language, and then compute the approximate degree between the matrix of the input character dot and the standard dot matrix. Finally, outputs the recognition results. This thesis is divided into three chapters. The first chapter mainly introduces knowledge about fuzzy mathematics such as background, research content and current trend of the field, then we give main reason for our study. The second chapter introduces some basic theoretical knowledge about fuzzy pattern recognition, especially the adjacent degree method which is commonly used in fuzzy pattern recognition. A Chinese characters handwriting recognition method is introduced in detail as an concrete example. The third chapter is the core of this thesis. It mainly introduces the realization of the fuzzy recognition about mathematical symbols. The basic procedures are as follows: First, users input the mathematic symbols by sketchpad, then the program is executed which transforms the symbols into a binary 16*16 matrix in two-dimension, then calculate the Hamming distance with each matrix in the standard bitmap. Finally, the program will output the symbol which is closest to the input symbol. Key words: fuzzy pattern recognition;
mathematic symbol;
adjacent degree;
matrix representation;
standard bitmap 目录摘要Abstract 第1章 前言 (1) 1.2模糊数学的研究内容 (2) 1.3选题意义 (4) 第2章 模糊识别的相关理论 (5) 2.1模糊模式识别相关知识及理论 (5) 2.1.1模糊度 (5) 2.1.2 闵可夫斯基距离 (5) 2.1.3贴近度 (7) 2.1.4 模糊模式识别原则 (7) 2.2手写文字的识别 (8) 第3章 数学符号的模糊识别 (10) 3.1 前期准备与理论 (10) 3.2具体应用 (10) 3.2.1标准点阵的转化 (10) 3.2.2 标准库的建立 (11) 3.2.3模糊模式识别 (13) 3.3 结果检验 (15) 3.4 总结 (16) 参考文献 (17) 致谢(18) 附录一 (19) 附录二 (21) 附录三 (23) 附录四 (27) 附录五 (32) 附录六 (37) 第1章 前言 现代数学是建立在集合论的基础上.集合论的重要意义就一个侧面看,在与它把数学的抽象能力延伸到人类认识过程的深处.一组对象确定一组属性,人们可以通过说明属性来说明概念(内涵),也可以通过指明对象来说明它.符合概念的那些对象的全体叫做这个概念的外延,外延其实就是集合.从这个意义上讲,集合可以表现概念,而集合论中的关系和运算又可以表现判断和推理,一切现实的理论系统都可能纳入集合描述的数学框架. 但是,数学的发展也是阶段性的.经典集合论只能把自己的表现力限制在那些有明确外延的概念和事物上,它明确地限定:每个集合都必须由明确的元素构成,元素对集合的隶属关系必须是明确的,决不能模棱两可.对于那些外延不分明的概念和事物,经典集合论是暂时不去反映的,属于待发展的范畴. 在较长时间里,精确数学及随机数学在描述自然界多种事物的运动规律中,获得显著效果.但是,在客观世界中还普遍存在着大量的模糊现象.以前人们回避它,但是,由于现代科技所面对的系统日益复杂,模糊性总是伴随着复杂性出现. 各门学科,尤其是人文、社会学科及其它 软科学 的数学化、定量化趋向把模糊性的数学处理问题推向中心地位.更重要的是,随着电子计算机、控制论、系统科学的迅速发展,要使计算机能像人脑那样对复杂事物具有识别能力,就必须研究和处理模糊性. 我们研究人类系统的行为,或者处理可与人类系统行为相比拟的复杂系统,如航天系统、人脑系统、社会系统等,参数和变量甚多,各种因素相互交错,系统很复杂,它的模糊性也很明显.从认识方面说,模糊性是指概念外延的不确定性,从而造成判断的不确定性. 在日常生活中,经常遇到许多模糊事物,没有分明的数量界限,要使用一些模糊的词句来形容、描述.比如,比较年轻、高个、大胖子、好、漂亮、善、热、远…….在人们的工作经验中,往往也有许多模糊的东西.例如,要确定一炉钢水是否已经炼好,除了要知道钢水的温度、成分比例和冶炼时间等精确信息外,还需要参考钢水颜色、沸腾情况等模糊信息.因此,除了很早就有涉及误差的计算数学之外,还需要模糊数学. 人与计算机相比,一般来说,人脑具有处理模糊信息的能力,善于判断和处理模糊现象.但计算机对模糊现象识别能力较差,为了提高计算机识别模糊现象的能力,就需要把人们常用的模糊语言设计成机器能接受的指令和程序,以便机器能像人脑那样简洁灵活的做出相应的判断,从而提高自动识别和控制模糊现象的效率.这样,就需要寻找一种描述和加工模糊信息的数学工具,这就推动数学家深入研究模糊数学.所以,模糊数学的产生是有其科学技术与数学发展的必然性. 1965年,美国控制论专家、数学家Zadeh发表了论文《模糊集合》,标志着模糊数学这门学科的诞生. 1.2模糊数学的研究内容 模糊数学的研究内容主要有以下三个方面: 第一,研究模糊数学的理论,以及它和精确数学、随机数学的关系.察德以精确数学集合论为基础,并考虑到对数学的集合概念进行修改和推广.他提出用 模糊集合 作为表现模糊事物的数学模型.并在 模糊集合 上逐步建立运算、变换规律,开展有关的理论研究,就有可能构造出研究现实世界中的大量模糊的数学基础,能够对看来相当复杂的模糊系统进行定量的描述和处理的数学方法. 在模糊集合中,给定范围内元素对它的隶属关系不一定只有 是 或 否 两种情况,而是用介于0和1之间的实数来表示隶属程度,还存在中间过渡状态.比如 老人 是个模糊概念,70岁的肯定属于老人,它的从属程度是 1,40岁的人肯定不算老人,它的从属程度为 0,按照Zadeh给出的公式,55岁属于 老 的程度为0.5,即 半老 ,60岁属于 老 的程度0.8.Zadeh认为,指明各个元素的隶属集合,就等于指定了一个集合.当隶属于0和1之间值时,就是模糊集合. 第二,研究模糊语言学和模糊逻辑.人类自然语言具有模糊性,人们经常接受模糊语言与模糊信息,并能做出正确的识别和判断. 为了实现用自然语言跟计算机进行直接对话,就必须把人类的语言和思维过程提炼成数学模型,才能给计算机输入指令,建立和是的模糊数学模型,这是运用数学方法的关键.Zadeh采用模糊集合理论来建立模糊语言的数学模型,使人类语言数量化、形式化. 如果我们把合乎语法的标准句子的从属函数值定为1,那么,其他文法稍有错误,但尚能表达相仿的思想的句子,就可以用以0到1之间的连续数来表征它从属于 正确句子 的隶属程度.这样,就把模糊语言进行定量描述,并定出一套运算、变换规则.目前,模糊语言还很不成熟,语言学家正在深入研究. 人们的思维活动常常要求概念的确定性和精确性,采用形式逻辑的排中律,既非真既假,然后进行判断和推理,得出结论.现有的计算机都是建立在二值逻辑基础上的,它在处理客观事物的确定性方面,发挥了巨大的作用,但是却不具备处理事物和概念的不确定性或模糊性的能力. 为了使计算机能够模拟人脑高级智能的特点,就必须把计算机转到多值逻辑基础上,研究模糊逻辑.目前,模糊逻辑还很不成熟,尚需继续研究. 第三,研究模糊数学的应用.模糊数学是以不确定性的事物为其研究对象的.模糊集合的出现是数学适应描述复杂事物的需要,Zadeh的功绩在于用模糊集合的理论找到解决模糊性对象加以确切化,从而使研究确定性对象的数学与不确定性对象的数学沟通起来,过去精确数学、随机数学描述感到不足之处,就能得到弥补.在模糊数学中,目前已有模糊拓扑学、模糊群论、模糊图论、模糊概率、模糊语言学、模糊逻辑学等分支. 模糊数学目前在自动控制技术领域仍然得到最广泛的应用,所涉及的技术复杂繁多,从微观到宏观、从地下到太空无所不有,在机器人实时控制、电磁元件自适应控制、各种物理及力学参数反馈控制、逻辑控制等高新技术中均成功地应用了模糊数学理论和方法. 模糊数学在计算机仿真技术、多媒体辨识等领域的应用取得突破性进展,如图像和文字的自动辨识、自动学习机、人工智能、音频信号辨识与处理等领域均借助了模糊数学的基本原理和方法. 模糊聚类分析理论和模糊综合评判原理等更多地被应用于经济管理、环境科学、安全与劳动保护等领域,如房地价格、期货交易、股市情报、资产评估、工程质量分析、产品质量管理、可行性研究、人机工程设计、环境质量评价、资源综合评价、各种危险性预测与评价、灾害探测等均成功地应用了模糊数学的原理和方法. 地矿、冶金、建筑等传统行业在处理复杂不确定性问题中也成功地应用了模糊数学的原理和方法,从而使过去凭经验和类比法等处理工程问题的传统做法转向数学化、科学化,如矿床预测、矿体边界确定、油水气层的识别、采矿方法设计参数选择、冶炼工艺自动控制与优化、建筑物结构设计等都有应用模糊数学的成功实践. 我国医药、生物、农业、文化教育、体育等过去看似与数学无缘的学科也开始应用模糊数学的原理和方法,如计算机模糊综合诊断、传染病控制与评估、人体心理及生理特点分析、家禽孵养、农作物品种选择与种植、教学质量评估、语言词义查找、翻译辨识等均有一些应用模糊数学的实践,并取得很好效果. 1.3选题意义 汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋.所以在信息技术及计算机技术日益普及的今天,如何将文字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我过得到普及的应用. 目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种.其中人工键入速度慢而且劳动强度大;