编辑: bingyan8 | 2016-04-23 |
一、软件说明 紫光以清华大学电子工程系为技术依托,隆重推出 基于识别的原文重现 自动电子出版 物制作系统(TH-OCR 紫光专业版).
该系统通过了国家教育部组织的专家鉴定会的鉴定.该出版 系统是国内外首次推出的能同时识别超大字符集(13051 字)和超多种汉字字体(近百种)、并 且将电子文档的错误率降低到万分之一以下的、能将复杂报纸杂志文档经版面分析、识别、理解,最后自动精确重构为原式原样的标准格式电子文档的电子出版系统,为我国信息资源建设提 供了一个快捷、高效的系统解决方案,是一个具有划时代意义的创举.TH-OCR 紫光专业版是一 套理想的中英文印刷体自动识别系统,可广泛应用于办公自动化的资料录人、文献建档、资料处 理、信息管理、智能翻译等领域.
二、软件操作 注意:随紫光扫描仪一起赠送的 TH-OCR 紫光专业版,需要与紫光扫描仪配套使用,请 在正确安装紫光扫描仪之后使用.
1
1、 、软 软件 件界 界面 面及 及功 功能 能说 说明 明 在不同的操作状态,分别有图像版面分析和编辑修改两种界面. 软件界面一:图像版面分析界面 软件界面二:编辑修改界面后改编工具条 工具条中各快捷作按钮的功能说明如下: 打开 扫描 打印 识别 倾斜校正 旋转图像 缩小 竖排正文 图形图像 全部识别 导出 版面分析 放大 横排正文 表格 识别字体 复制 撤消 前向词汇 相似字 帮助 剪切 粘贴 查找 逆向词汇 常用符号
2
2、 、操 操作 作? ?程 程TH-OCR 紫光专业版的操作流程分为设置、获取图像、版面分析、文字识别、编 辑修改等五步,如图所示: 设置 使用系统前应根据应用环境及需求设定系统参数.从 命令 菜单选择 设置 命令, 在打开的 设置 对话框中可对系统、扫描、识别、后编改及其它(表格、版面分析等)参 数进行设定.这些参数一般按默认设置即可. 获取所要识别的图像文件 获取所要识别的图像文件有两种方式:通过扫描仪扫描新的图像或打开已有图像文件. 如果要扫描新的图像,则应从 文件 菜单选择 扫描 命令或单击工具条上的扫描图 标 ,对所要识别的稿件进行扫描.扫描完成后退出扫描界面.识别后,文件将不直接出 现在识别界面中,双击被识别图像文件左边的 + 号,出现识别后的文件名,双击该文件 名,即可打开该文件进行编辑修改,当文件为横排时,右侧上部为识别后文本窗口,右侧下 部为局部图像窗口;
当文件为竖排时,识别后文本窗口和识别前局部图像窗口左右排列,如 下图: 对于磁盘上原有保存好的图像文件,可以直接从 文件 菜单中选择 打开 命令或单击工具条上的打开图标 ,在 打开 对话框中指定路径、文件 类型、文件名,单击 打开 按钮,即可将选定的图像文件显示在工程管理窗 口.同Windows 的操作一样,如要一次打开多个文件,请使用 Ctrl 或 Shift 按键选择相应文件打开即可.图像文件打开后,显示在图像窗口中, 与扫描得到的图像相似.打开多个文件进行识别时,所识别得到的文本作为工 程将按选中文件列表中的文件顺序排列在工程管理窗口. 提示:扫描仪的操作请参照随同扫描仪附送的用户手册的指导. 注意: 1. TH-OCR 紫光专业版 可以识别彩色、灰度和黑白二值的图像,扫描 时的扫描模式可任意设置. 2. 对普通书本的印刷质量,字号在