编辑: 645135144 | 2018-11-09 |
张林同 学论文的选题具有重要的理论价值,并在文档图像检索领域具有广泛的应用前 景. 从申请保送研究生开始, 张林同学围绕着本课题进行了八个多月的学习和研 究,在阅读大量的中英文专业文献基础上,比较独立地进行了研究工作.针对包 含
图表、多种文字和版式的复杂结构文档图像的分类问题进行研究,通过对文档 图像整体结构的分析,提出了一种基于版面特性的文档图像快速分类方法.在包 含中、日、英等多种文字,1000 多幅文档图像组成的较大规模数据库中实现了 自己的算法,并验证了该算法的有效性.该论文工作为相关的国际合作项目提供 了的技术和方法,做出了贡献. 论文写作规范,语言流畅,逻辑性强,结合相关的理论方法给出了比较、分 析和评价,实验结果翔实可靠.说明作者掌握了本学科领域的基础知识和基本技 能,初步具备了从事科学研究的能力,并表现出一定的创新能力和探索精神,完 成了一篇有新意的高水平毕业论文. 推荐申请信息科学技术学院的优秀毕业论文. 指导教师_ (签字) 年月日北京大学 本科生毕业设计论文 基于版面特征的文档图像 快速分类方法 Fast Classification of document images based on Layout Features 姓名:张林 学号:00107131 院系:信息科学技术学院电子学系 专业:电子信息科学与技术 指导老师:刘宏 副教授 查红彬 教授 二零零五年六月北京大学本科生毕业论文 基于版面特征的文档图像快速分类方法 北京大学信息科学技术学院
2005 年6月-I- 摘要文档图像的分类是文档图像处理技术的一个重要方面, 对文档图像检索系统 的性能有着很大的影响,正确快速的分类可以显著提高检索和识别效率. 本文基于上述应用前景, 对包含
图表、多种版式和文字的复杂文档图像的分 类问题进行研究,提出一种基于版面特性(Based on Layout Feature,简称为 BLF)的文档图像快速分类方法.该算法由文档图像的整体结构出发,按照自顶向 下的顺序将图像进行分割,得到图像结构特征,实现对图像的粗分类.大量的实 验表明,该算法具有准确度高,鲁棒性强的特点. 论文的
第一章将介绍图像文档检索系统和 OCR 系统, 论述文档图像的分类在 其中的位置和作用,并提出本文的工作目标.
第二章将介绍图像的预处理过程.
第三章是本文的重点,将着重论述特征提取过程.
第四章将介绍为检验该算法所 进行的实验,并对实验结果给予分析和比较.最后,对全文的工作进行总结,并 对未来的工作进行展望. 关键词文档图像 二值化 特征提取 图像检索 北京大学本科生毕业论文 基于版面特征的文档图像快速分类方法 北京大学信息科学技术学院
2005 年6月-II- Abstract Classification of document images is an important part of image processing techniques. It has quite an effect on document image retrieval systems, proper and fast classification can improve the retrieval and recognition efficiency evidently. Based on the applications and foregrounds, this thesis researches document images with complex layout and designs an algorithm named BLF for documents classification .It analyses the document layout from top to bottom. A lot of experiments show that this algorithm is accurate and robust. In chapter