欢迎光临广东省盲人协会网站
盲人不必依靠他人也能阅读书报杂志
  自从有了文字以来,盲人要想获得用文字所记录的信息,必须依*明眼人念给他们听,若想将这些文字记录下来,那就更费周折了。而“OCR”光学字符识别技术的出现,不仅给文字录入工作带来了便利,同时更为盲人朋友愉悦获取印刷品信息提供了极大帮助。
  “OCR”是英文“Optical Character Recognition”的缩写,意思为光学字符识别,通称为文字识别。它的工作原理是通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中。由此可以看出,“OCR”实际上是让计算机认字,实现文字自动输入。它是一种快捷、省力、高效的文字输入方法。本文就以北京汉王科技有限公司以“OCR”光磁识别技术研发而推出的“汉王文本王”为例加以论述。
一、系统概述
  “汉王文本王”是汉王公司采用最新的“OCR”光学印刷体字符识别技术,集成文本阅读校对开发的一套高效输入、快捷办公的精品软件系统。它具有许多优点:
(1)智能识别,准确无误:全智能识别核心,识别速度快,识别效率高;
(2)一键扫入,“Word”输出:用户操作简单快捷,与“Word”无缝连接,只需轻松按下一键,文档自动输出到“Word”;
(3)多种模式,任君选择:用户可根据工作需要或个人习惯选择自动、单步智能工作模式或专业批量工作模式;
(4)复杂版面,自动分析:智能分析各种中英文、繁简体、表图混排格式的文本,无需过多人工干预;
(5)表格输入,轻松实现:多样化的表格判识,完美精确的表格还原,瞬间即可转化成为可任意编辑的电子表格;
(6)批量输入,快速高效:大批量的文件扫描,全自动化的文字识别,速度快,效率更高;
(7)版面还原,原文重现:精确保留了原版面格式,准确恢复文本原貌;
(8)文件保存,多种格式:识别完的文档可以保存为多种格式(PDF、HTML、RTF、XLS、TXT)的文件,方便实用;
(9)图文索引,方便快捷:识别完成,轻松导出ACDSee图文索引,助您实现图片快速检索;
(10)工程管理,更加轻松:工程文件方便管理,工作进度随时保存,打开工程文件即可继续工作;
(11)表格拼接,简单易用:A3表格拼接功能,轻松实现A4表格拼接输出为A3表格的需求;
(12)摘抄高手,随心所欲:随时摘抄,即时编辑,任意发送到文字操作窗口;
(13)文本朗读、翻译,省时省力:汉王阅读小精灵,避免眼睛疲劳,让您随心所欲听;翻译软件助您跨越语言障碍。
“汉王文本王”可以识别简体字符集,包括国标GB2312-80的全部一二级汉字6800多个,并能识别纯英文字符集。除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字;能识别宋体、仿宋、楷体、黑体、魏碑、隶书、圆体、行楷等100多种字体,并支持多种字体混排;识别字号范围从初号至小六号字体。
一般的识别条件下,“汉王文本王”对印刷体文稿能达到99.5%的识别正确率。在PⅡ-233计算机上,印刷文稿识别速度达120字/秒。
二、系统安装
1.安装配置要求
(1)主机:Pentium 233以上CPU;
(2)内存:64MB以上,Win2000/ XP建议128MB;
(3)硬盘空间:210M以上;
(4)USB接口:要配有USB接口;
(5)操作系统:简体、英文Windows98/ME/2000/XP,英文Windows 98/ME必须外挂中文平台(如Richwin for Windows 98/ME),英文Windows 2000/XP区域设置必须是中国,默认语言必须是简体中文。
(6)特别提示:为了更充分发挥“汉王文本王”的特色功能,请务必安装微软字处理软件“Word”,推荐使用Word 2000。
2.软件安装
(1)插入标有“汉王文本王”字样的安装光盘到光盘驱动器。v
(2)如果光盘自动运行,弹出安装界面,请按下Alt加F4键退出该界面。若不能自动运行,请用Windows快捷键弹出“开始菜单”,用上、下、左、右光标键选中“我的电脑”弹出“资源管理器”窗口,用上、下、左、右光标键找到“光盘驱动器”,按回车键将其打开,用上、下、左、右光标键找到hwdoc文件夹按回车键,再用上、下、左、右光标键找到Setup后按回车键运行安装。
(3)安装界面用小键盘的4、6或Tab键进行切换,根据提示音选中“下一步”连续按下小回车或回车键,建议您不要把文本王安装到C盘,请您用4、6或Tab键切换至“浏览”,按下小回车或回车键弹出“列表对话框”,用上、下光标键选择相应路径,如D:\HWDOC_KING。
如果您要安装“桑夏译王”、“译星99”,请用Tab键切换,用上、下光标键选择,按空格键选中。用4、6、5或Tab键切换听读,根据提示音选中“下一步”,按小回车或回车键继续安装。从安装界面根据需要用4、6或Tab键切换,用上、下、左、右光标键选择其他的附赠软件,用4、6、5或Tab键切换听读,按照屏幕提示音按小回车或空格键安装。
3.软件卸载
可以从程序组卸载软件:用Windows快捷键弹出“开始”菜单,用上、下、左、右光标键选中“所有程序”,然后按右光标键弹出“所有程序”菜单,用上、下光标键选中“汉王文本王”,按右光标键弹出“汉王文本王”子菜单,用上、下光标键选中“卸载汉王文本王”按下回车键,弹出卸载文件确认框,用小键盘的4、6或Tab键切换至“确定”,按下小回车或回车键即可完全卸载“汉王文本王”。
4.硬件安装
所有“汉王文本王”的扫描仪都称为文本王扫描仪,仅有型号的不同,请根据购买扫描仪的型号参看合适的扫描仪安装与使用方法。型号以板底签上的机种型号为主。本文仅依“HanWang 4300U”为例。
(1)检查包装。在您打开包装开始使用之前,请根据您购买的版本检查包装内容:
①标配扫描仪系列:文本王扫描仪、扫描仪电源适配器、USB连接线。
②非标配扫描仪系列:没有扫描仪及其配件,只有一小钥匙加密狗。
文本王软件光盘、文本王使用手册各系列均配备。若任何配件发生损坏或缺少,请尽快与经销商联系。该款扫描仪板底签上机种型号为:HWWBW4300-6678-9DM。
(2)扫描仪安装。特别提示:请先安装文本王扫描仪驱动,再连接扫描仪到计算机USB接口。
①驱动安装:
插入标有“汉王文本王”字样的安装光盘到光盘驱动器。光盘自动运行,弹出安装界面,请按下Alt加F4键退出该界面,若不能自动运行,请用Windows快捷键弹出“开始菜单”,用上、下、左、右光标键选中“我的电脑”弹出“资源管理器”窗口,用上、下、左、右光标键找到“sdriver”按下回车键打开该文件夹,用上、下、左、右光标键找到“Setup”按回车键运行安装。
建议按系统默认安装,只需用小键盘的4、6或Tab键切换至“下一步”按下小回车或回车键即可。
②硬件连接:
A.解开保护锁:请打开扫描仪掀盖。在*近玻璃面板右下方处有一个保护锁,用以保护扫描仪内部的光学组件。请将开关打开以解锁。今后在搬动扫描仪前,请先将保护锁锁上。
B.连接扫描仪:需要注意的是,将扫描仪连接到计算机前,请先确定您已安装扫描仪驱动。
将USB连接线一端接上计算机,另一端连接扫描仪。然后将电源适配器接上扫描仪与电源插座,扫描仪电源即自动开启,这时Windows会弹出找到新硬件提示窗口,在Windows 98/ME/2000下系统会自动安装驱动程序,不需要人工干预,而在Windows XP下需按提示选择安装,首先用小键盘的4、6或Tab键切换至“从列表安装”按下小回车或空格键选中。再用4、6或Tab键切换至“下一步”和“仍然继续”,连续按下小回车或回车键,直到完成新硬件安装。以上操作全部完成后,扫描仪面板上的LED指示灯会持续亮着。
C.进行扫描:将一份待扫描文稿需扫描的一面朝下,放置于扫描仪玻璃面板上,然后盖上面盖。
③驱动卸载:
用Windows快捷键弹出“开始菜单”,用上、下、左、右光标键选中“控制面板”按回车键,用上、下、左、右光标键选中“添加/删除程序”按回车键,用上、下光标键选中“MiraScan V5.01”,用Tab键切换至“删除”按钮,按下回车键即可完全卸载文本王扫描仪。
(3)小钥匙安装:所有文本王的加密狗都叫小钥匙,请根据您购买版本的具体型号恰当安装。
①HASP驱动安装(仅适用于汉王文本王软件版):
A.插入标有“汉王文本王”字样的安装光盘到光盘驱动器。
B.光盘自动运行,弹出安装界面,按下Alt加F4键退出该界面,若不能自动运行,请用Windows快捷键弹出“开始菜单”,用上、下、左、右光标键选中“我的电脑”弹出“资源管理器”窗口,用上、下、左、右光标键找到“光盘驱动器”,按回车键将其打开,用上、下、左、右光标键找到“driver”文件夹按下回车键,用上、下、左、右光标键找到“Hdd32.exe”按下回车键运行安装。用Tab键切换至“语言选择对话框”,用上、下光标键选中“U.S English”,用小键盘的4、6或Tab键切换至“OK”按下小回车或回车键。接下来只需用4、6或Tab键切换至“Next”按下小回车或回车键即可。最后会提示您设备安装完成,用4、6或Tab键切换至“Finish”按钮按下小回车或回车键完成安装。
②连接设备:设备驱动程序安装完成,重新启动计算机插上USB小钥匙即可。
特别提示:如果在启动文本王时出现其他提示,那可能是因为您打开了VC++等程序调试工具,请即时关闭,重新启动文本王即可。
③驱动卸载:用Windows快捷键弹出“开始菜单”,用上、下、左、右光标键选中“控制面板”按回车键,用上、下、左、右光标键选中“添加/删除程序”按回车键,用上、下光标键选中“HASP Device Driver”,用Tab键切换至“更改/删除”按下回车键即可。
三、系统设置
用Windows快捷键弹出开始菜单,用上、下、左、右光标键选中所有程序,用右光标键弹出所有程序菜单,用上、下光标键选中“汉王文本王”,用右光标键弹出“汉王文本王子菜单”,用上、下光标键选中“文本王专业版”启动文本王专业版,用Alt键击活程序上方的菜单栏,用左、右光标键选中文件菜单,用下光标键弹出该菜单,用上、下光标键选中“系统配置”,按回车键进入“设置系统参数”对话框。用小键盘的4、6或Tab键切换至“选项卡列表”(该选项卡列表共有五项,分别为:获取新图像选项卡、识别选项卡、插入“Word”选项卡、创建“Rtf”选项卡及输出图像选项卡),用1、3键或左、右光标键可在五个选项卡列表之间随意切换,按小回车键可将选中的“选项卡列表”激活,而左、右光标键则可直接激活被Tab键切换而选中的“选项卡列表”。
1.“获取新图像”选项卡
用4、6或Tab键切换至“语言”的“简体”复选框按小回车或空格键将其选中,用4、6或Tab键切换至“扫描图像文件”的“灰度彩色图像扫描保存为JPG格式”复选框按小回车或空格键将其选中,用4、6或Tab键切换至“扫描分辨率”的“400dpi”复选框按小回车或空格键将其选中,用4、6或Tab键切换至“扫描图像”的“灰度”复选框按小回车或空格键将其选中。
2.“识别”选项卡
用4、6或Tab键切换至“识别选项”的“自动倾斜校正”复选框按小回车或空格键将其选中。
3.“插入Word”选项卡
用4、6或Tab键切换至“Word版本”的“自动检测”复选框按小回车或空格键取消其选中,用4、6或Tab键切换至“Wordxp”复选框按小回车或空格键将其选中,如果对精确版面还原没有严格要求的,可用4、6或Tab键切换至“输出选项”的“过滤段内回车换行符”复选框按小回车或空格键将其选中。
4.“创建Rtf”选项卡
用4、6或Tab键切换至“输出选项”的“精确版面还原”复选框按下小回车或空格键将其选中。
5.“输出图像”选项卡
用4、6或Tab键切换至“灰度图像”的“灰度图像去底色”复选框按小回车或空格键将其选中,最后用4、6或Tab键切换至“应用”,按小回车或回车键使所有新设置生效,用4、6或Tab键切换至“确定”,按小回车或回车键以完成此操作。
四、文本王一键OK
“汉王文本王一键OK”是一种智能扫描录入方式,无需过多的人工干预,依工作方式不同分为自动与单步两种工作模式。在自动工作模式下只需轻松按下扫描仪的扫描按键,文档即可自动输出到Word。如果用户希望手工指定识别区域或校对,则可以选择单步工作模式,在程序引导下逐步完成工作。本文仅对自动工作模式进行详细论述。
1.主操作界面
(1)一键OK主界面与功能介绍:按下文本王扫描仪的扫描按键或者用Windows快捷键弹出“开始”菜单,用上、下、左、右光标键选中“所有程序菜单”,用右光标键弹出“所有程序菜单”,用上、下光标键选中“汉王文本王”,用右光标键弹出“汉王文本王子菜单”,用上、下光标键选中“文本王一键OK”,按小回车键弹出文本王一键OK主界面。
(2)文本王主菜单:用4、6或Tab键切换至“汉王logo”,当听到“一按下按钮提示音时”,按下小回车或回车键弹出系统配置菜单(因系统配置已在前文进行了详细论述,故不再重复论述),用上、下光标键选中“选择扫描仪”,当听到“二”提示音时按下回车键弹出“选择来源主界面”,用Tab键切换至“来源列表”,用上、下光标键选中文本王扫描仪“HanWang V5.01”。
特别提示:每次新安装或进行插拨后,运行操作时必须对扫描仪进行选择,以确保扫描仪的正确调用。
(3)工作模式的选择:用4、6或Tab键切换至“自动”复选框,按小回车或回车键将其选中,以自动模式工作。
特别提示:工作模式选择为自动时,扫描不仅指扫描,它包含了从图像扫描、图像处理、版面分析、识别在内的一系列后处理过程,直至输出文档。
(4)选择输出方式:用户可以根据需要选择输出方式,用4、6或Tab键切换至“选择输出方式”连续按下小回车或回车键,可以切换扫描输出方式,共有插入“Word”、创建“Rtf”及文件三种不同的输出方式,可根据需要进行选择。
建议:盲人朋友在使用文本王时,选择插入“Word”较为适宜。
注:选择输出方式只对自动模式有效。
(5)启动扫描:用4、6或Tab键切换至“扫描”按钮按小回车或回车键可启动扫描仪进行图像扫描,并按指定工作模式进行相应的后续工作。
(6)汉王阅读精灵:用4、6或Tab键切换至“阅读”,可以启动汉王阅读精灵,对选中文字、文件进行阅读;可以将选中文字朗读为声音文件或朗读已存在的声音文件。
(7)退出“文本王一键OK”:用4、6或Tab键切换至“汉王logo”,当听到“一按下按钮提示音时”,按小回车或回车键弹出“系统配置菜单”,用上、下光标键选中“退出”,当听到提示音“七”时,按下回车键,文本王一键OK程序即可退出。
五、文本王专业版
文本王专业版由于主界面过于复杂,用读屏程序只能进行小范围的操作,开发人员为本程序设计了方便操作的快捷键和工具按钮,本文略加论述,仅供参考。
1工具栏按钮
扫描按钮:打开扫描好的图像文件,
选中全部图像文件,对所选图像进行识别。
对所选图像进行版面分析。
标记/修改当前版面栏的属性,依次为横栏、竖栏、表格、图像、英文。
取消当前版面栏:将光标恢复成鼠标状态,
去除版面噪音,如黑框等在图像页上画线,弥补断线或将表格填补成标准表格,
调出系统配置对话框插入到Word。
这些按钮均可用小键盘的4、6、5或Tab键在其之间进行切换听读,按下小回车或回车键,则可运行其相应的程序功能。用Alt键可激活程序主界面最上方的菜单栏,用左、右光标键可在文件、编辑、识别、输出、显示和帮助之间切换,用下光标键可弹出所选中的菜单,用上、下光标键可选择菜单中所列的所有可执行项,按下回车键则可运行选中的程序。
2快捷键
扫描文件:按下“Ctrl+N”键调出扫描仪,获取图像文件。
打开文件:按下“Ctrl+O”键打开图像文件,追加图像文件。
保存图像:按下“Ctrl+S”键保存图像。
新建工程:按下“F2”键建立新工程。
打开工程:按下“F3”键打开工程文件。
保存工程:按下“F4”键保存工程。
图像放大:按下小键盘上的“+”键可以将图像放大。
图像缩小:按下小键盘上的“-”键可以将图像缩小。
图像反白:按下“Ctrl+I”键将图像反白。
自动倾斜校正:按下“Ctrl+D”键进行自动倾斜校正。
手动倾斜校正:按下“Ctrl+M”键进行手动倾斜校正。
版面分析:按下“F5”键,对选中的文件进行版面分析。
取消版面分析:按下“Ctrl+Del”键,取消当前页的版面分析。
取消当前栏:按下“Del”键或“Esc”键,取消当前栏属性标识。
开始识别:按下“F8”键,对选中的文件进行识别。
光标切换:按下“F9”键,光标在图像剪切工具、图像画线工具、鼠标三种状态间切换。
左转图像:按下“Ctrl+L”将图像左转90度。
右转图像:按下“Ctrl+R”将图像右转90度。
旋转图像:按下“Ctrl+F”将图像旋转180度。
向后翻页:按下“Ctrl+Page down”向后翻页。
向前翻页:按下“Ctrl+Page up”向前翻页。
撤消:按下“Ctrl+Z”键取消上一步操作。
剪切:按下“Ctrl+X”键剪切选中的内容。
复制:按下“Ctrl+C”键复制选中的内容。
粘贴:按下“Ctrl+V”键粘贴选中的内容。
向后找可疑字:按下“Ctrl+Tab”键。
向前找可疑字:按下“Shift+Tab”键。
退出文本王:按下“Alt+F4”键。
“OCR”光磁识别技术的出现,不仅给文字录入工作者带来了便利,对盲人朋友来说更带来了福音,毕竟可以不必依*他人的帮助而自由地浏览书报杂志甚至所有的印刷品文献了。该软件不是专门为盲人开发的,虽然软件本身还存在着许多不尽人意的地方,但对提高盲人的工作、学习和生活质量,对提高盲人群体的整体综合素质,乃至拓展盲人的就业,均有着重要的现实意义。
参考文献:
《汉王文本王使用手册》,北京汉王科技有限公司

文章录入:admin    责任编辑:admin 
  • 上一篇文章:

  • 下一篇文章:
  •  

    Copyright @ 2006-2015 版权所有:广东省盲人协会
    协会地址:协会地址:广东省广州市越秀区东风东路钱路头直街2号3楼306房

    粤ICP备15075832号

    粤公网安备 44010402000491号