编辑: 645135144 2018-11-09

1 of the thesis, we describe document image retrieval systems and OCR systems, then explain the effect of documents classification in the systems. The pre-processing steps will be introduced in chapter 2. Chapter

3 is the most important part of the thesis. It will discuss feature extract in details. In chapter 4, several experiments to verify the algorithm will be introduced , analysis and comparison of the experimental results will also be given. Lastly, conclusions and prospect of our research work will be given. Key words: Document Image, Binarization, Feature Extract, Image Retrieval 北京大学本科生毕业论文 基于版面特征的文档图像快速分类方法 北京大学信息科学技术学院

2005 年6月-III- 目录摘要IAbstract.II 目录III

图表索引.V

第一章 概述

1 - 1.1 文档图像检索系统.1 - 1.1.1 系统结构.1 - 1.1.2 粗分类在文档图像检索系统中的作用.3 - 1.2 OCR 系统.3 - 1.2.1 OCR 技术的发展.3 - 1.2.2 OCR 系统的方法与原理.4 - 1.2.3 数据库粗分类在 OCR 系统中的作用.5 - 1.3 本文的研究工作.6 - 1.3.1 工作的目标:6 - 1.3.2 方法概述.10 -

第二章 图像的预处理.11 - 2.1 灰度图像的转换.11 - 2.2 图像分割和图像阈值概述.11 - 2.3 传统的二值化方法介绍.13 - 2.3.1 经典的全局阈值算法.13 - 2.3.2 局部阈值方法和动态阈值选取.14 - 2.4 本文采用的二值化方法.15 - 2.4.1 图像平滑.16 - 2.4.2 求解 Laplacian 算子.20 - 2.4.3 确定阈值.22 - 2.5 求出二值化图像.22 -

第三章 特征提取与分类方法

24 - 3.1 常用的图像检索方法.24 - 3.1.1 基于颜色的检索.24 - 3.1.2 纹理特征.25 - 3.1.3 基于形状的检索.26 - 3.1.4 基于轮廓特征的检索.27 - 3.2 本文采用的特征提取方法.27 - 3.2.1 数据结构定义.27 - 3.2.2 水平和垂直方向的空白背景区域检测.29 - 3.2.3 分区.30 - 3.3 分类方法.34 -

第四章 实验与分析.38 - 4.1 实验条件.38 - 北京大学本科生毕业论文 基于版面特征的文档图像快速分类方法 北京大学信息科学技术学院

2005 年6月-IV- 4.2 参数设置.38 - 4.3 对转换文档进行的测试.39 - 4.4 BLF 算法的时间性能.40 - 4.5 分析与讨论.42 -

第五章 总结与展望.44 - 5.1 总结.44 - 5.2 遇到的问题与解决方案.44 - 5.3 研究工作展望.45 - 致谢.46 - 参考文献.47 - 北京大学本科生毕业论文 基于版面特征的文档图像快速分类方法 北京大学信息科学技术学院

2005 年6月-V-

图表索引 图1-1 DIR 系统的结构框架.1 - 图1-2 DIR 系统的算法流程图.2 - 图1-3 OCR 系统的流程图.5 - 图1-4 第一类文档图像.7 - 图1-5 第二类文档图像.7 - 图1-6 第三类文档图像.8 - 图1-7 第四类文档图像.8 - 图1-8 第五类文档图像.9 - 图1-9 第六类文档图像.9 - 图1-10 基于版面特征的文档图像分类方法流程图.10 - 图2-1 拉普拉斯算法的流程图.16 - 图2-2 原始图像.17 - 图2-3 经过 Gaussian 模板的图像.18 - 图2-4 拉普拉斯算子图片.21 - 图2-5 二值........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题