欢迎光临广东省盲人协会网站
智能阅读机器人
  智能阅读机器人是采用计算机图像处理、文字识别、语音合成与语音识别等技术,实现图书、报刊、小说杂志等纸面信息的自动阅读。其设计思想独特,具有创新的理念和人性化的设计,结构简便合理,应用广泛,成本低,经检索查询,该系统在国内外尚未见报道,填补了我国阅读服务机器人领域的空白。
  该系统操作简单,完全利用语音指令控制,使用方便。系统的工作原理是:其图像采集与处理模块先将图书文字拍摄到文字识别系统中,并完成文字识别,而后经过文本转换、语音合成、语音识别等子系统,实现将书本上的内容朗读出来。系统原理如图1所示。
图1     一、系统功能
    (1)视觉系统功能。由数字图像采集设备完成文本的视觉图像采集,采集图像预处理,为文本图像识别软件提供高质量的输入;由摄像头完成动态视觉监控(发现换页,立即触发主机进行图像采集)。
    (2)图文混排文本识别和分割。高识别率的图文混排文本识别,并能有效区分文本和插图,从而实现文本和图片的有效分割和识别,以及自动的版面分析。
    (3)文本中标题和内容的分割、识别和分类检索。能够区分文本的标题和内容,并分类存储,并能根据标题实现相关内容的准确检索,并送语音合成模块进行阅读。
    (4)语音合成。运用先进的智能接口技术,实现文本识别与语音朗读系统智能衔接;实现中英文双语种识别朗读。
    (5)语音识别控制。能够进行自然语言指令识别,如:阅读、开始、停止、暂停等指令,而且能够根据使用者的指令阅读相关内容,如:使用者说“请阅读某一标题”,机器人就会根据该指令检索与该标题相关的内容进行阅读。
    (6)网络新闻阅读。根据语音输入的网站名称自动搜索网站,根据各网站提供的RSS新闻列表获取最新的新闻内容,根据语音指令选择阅读。
    二、采用技术
    (1)基于小波分析和模式识别的图文混排文本图像中插图与文本的识别和分割技术;
    (2)高识别率的OCR汉字英文的图文转换与识别技术;
    (3)基于标题的文本内容分割和存储、检索技术;
    (4)智能人机交互接口技术;
    (5)计算机自动语音合成和基于小波变换的语音识别技术;
    (6)根据各网站提供的RSS新闻列表获取最新的新闻内容,根据语音指令选择阅读。
    三、系统特点
    (1)低成本:8000元以下;国内外同类产品价格一般在四五万元;
    (2)结构简单,操作方便,易于产业化。
    四、系统特色
    (1)集图像采集、图像处理、文字识别、语音合成、语音识别、人机智能交互等多种先进的高新技术于一体,并将其应用于特殊社会服务领域中,利用先进适用技术服务于特殊社会群体,具有重要的社会意义和应用价值。
    (2)图文混排文本识别、分割和分类存储:能够对标题、正文、插图等混排的页面进行自动分割和分类,识别出标题、正文、图像等,并对识别出的标题和正文进行分类存储。
    (3)文本语音合成与自然语音识别:能将识别后的文本转换为语音朗读出来,能够识别用户发出的语音指令,根据语音指令控制机器人的阅读,并根据使用者说出的标题检索出相关内容进行阅读。
    (4)多方式智能阅读过程控制:一是通过安装的摄像头(两只眼睛),利用视觉检测,可以监控换页,实现阅读的起停;二是通过交互式语音控制阅读过程;三是根据页面内容,自然结束。
    (5)网络新闻的阅读:根据语音输入的网站名称自动搜索网站,根据各网站提供的RSS新闻列表获取最新的新闻内容,根据语音指令选择阅读。
    二、机器人外形效果图
    机器人外形如图2所示。
图2     智能阅读机器人系统可以帮助盲人和弱视群体阅读文本资料和互联网信息,增强他们平等参与社会的能力。
    该系统还可以在诸如家教服务、景点导航、各种数据库的信息咨询等更广泛的领域中得到应用,所以,智能阅读机器人具有较好的推广前景和市场空间,有着较大的实用价值和社会需求。
文章录入:admin    责任编辑:admin 
  • 上一篇文章:

  • 下一篇文章:
  •  

    Copyright @ 2006-2015 版权所有:广东省盲人协会
    协会地址:协会地址:广东省广州市越秀区东风东路钱路头直街2号3楼306房

    粤ICP备15075832号

    粤公网安备 44010402000491号