编辑: bingyan8 | 2016-04-23 |
5
5、 、调 调整 整文 文本 本顺 顺序 序 在版面分析中设定多个文本识别区域时,识别结果将按区域的编号顺序排 列.如需要调整识别区域的顺序,请在当前的区域内部,按鼠标右键,选择 区域顺序 ,在每个选择区域的左上角显示该区域的序号,双击该序号即可 调节,调节到你需要的顺序后,请在区域外的任何一处点击一下,则调节顺序 被确认. 注意: 调节任何一个区域的序号后,其它相关区域的顺序也会相应改变.
6
6、 、导 导出 出单 单页 页或 或多 多页 页文 文本 本文 文件 件 对扫描或打开的图像文件识别后的文本文件,如选择 文件 菜单中的 导出 命令或直接调用工具条上的 图标,会出现一个导出设置对话框, 在该对话框中有 导出当前页 和 所有页导出为一个文件 两个选项,如选 则 导出当前页 项,则只导出当前打开页的文件,如选择 所有页导出为一 个文件 则将所有打开页的文件全部导出后合并为指定的一个结果文件,对于 导出的文件,可以指定文件名、文件格式及文件的存储位置.
7
7、 、分 分辨 辨? ?设 设定 定与 与字 字号 号大 大小 小对 对照 照表 表 扫描图像时分辨率的设定请根据文稿上文字的大小,参照下表的推荐值:
8
8、 、常 常见 见问 问题 题 扫描时提示 装入 TWAIN.DLL 错误 . 请正确安装紫光扫描仪的驱动程序,连接好扫描仪,并将紫光扫描仪打开. 识别完成后屏幕为空白,只有光标闪动. 如果原稿中有图形,OCR 会认为此文件不符合要求而不作识别.此时应先 进行版面分析,将所要识别的文字区域按顺序框出识别区域后再进行识别. 识别出的文字出现乱码. 1. 是否文字的方向不对,请正确调整文字方向. 2. 是否定义的文字属性(简体多体、繁体多体、纯英文、手写体等)与原 稿不符,请设定相应的文字属性. 3. 是否原稿中的文字旁有辅助线,字体为斜体或艺术字等,此类原稿不 能被正确识别. 4. 扫描时设置的分辨率是否不合适,请在扫描时参照分辨率设定与字号 大小对照表中的推荐值选择适合的分辨率. 5. 扫描文稿时设定了镜像处理功能,扫描结果图像与原稿左右相反. 6. 原稿不清晰(如传真件、油印试卷、报纸等),若是报纸,可以适当地 调节图像的对比度或亮度以得到较好的扫描效果,提高识别率.文章 始部分识别率较高,但后面部分识别率低. 7. 原稿在扫描时摆放不正,若倾斜角度不大可进行倾斜校正,否则需重 新扫描. 表格识别时,只识别出表头而无表格. 没有单独定义出表格属性.请按表格的识别与导出部分的说明进行版面分 析. 识别繁体字得到简体字而非繁体字. 请从 Windows 操作系统的 开始 菜单指向 程序 中的 TH-OCR 紫光专 业版 程序组,选中 选择系统内码 选项,在 Select System Inner- code 对话框中选定 GBK -code(All China) . 如何使文件导出到 Microsoft Word 中. 导出时,选择 保存类型 为rtf 即*.rtf,即可在 word 中打开. 如何使文件导出到 Microsoft EXCEL 中. 导出时,选择 保存类型 为html 即*.htm,即可在 EXCEL 中打开. 如何使识别后的文件成为主页. 导出时,选择 保存类型 为html 即*.htm 即可,同时保持原稿原版面.
9
9、 、取 取得 得帮 帮助 助从 帮助 菜单选择 目录和索引 命令,显示帮助主题,可以选择帮助 主题或索引帮助内容;