正在加载

十大网投平台信誉排行榜
版本:v3.3.5
类别:理财
大小:362984KB
时间12月02日

十大网投平台信誉排行榜:OCR的基本原理



    OCR的基本原理

    原标题:OCR的基本原理

    十大网投平台信誉排行榜 十大网投平台信誉排行榜

    简单地说,OCR的基本原理就是通过扫描仪将一份文稿的图像输入给计算机,然后由计算机取出每个文字的图像,并将其转换成汉字的编码。其具体工作过程是,扫描仪将汉字文稿通过电荷耦合器件CCD将文稿的光信号转换为电信号,经过模拟/数字转换器转化为数字信号传输给计算机。计算机接受的是文稿的数字图像,其图像上的汉字可能是印刷汉字,也可能是手写汉字,然后对这些图像中的汉字进行识别。对于印刷体字符,首先采用光学的方式将文档资料转换成原始黑白点阵的图像文件,再通过识别软件将图像中的文字转换成文本格式,以便文字处理软件的进一步加工。其中文字识别是OCR的重要技术。

    1.OCR识别的两种方式

    与其它信息数据一样,在计算机中所有扫描仪捕捉到的图文信息十大网投平台信誉排行榜都是用0、1这两个数字来记录和进行识别的,所有信息都只是以0、1保存的一串串点或样本点。OCR识别程序识别页面上的字符信息,主要通过单元模式匹配法和特征提取法两种方式进行十大网投平台信誉排行榜字符识别。

    单元模式匹配识别法(Pattern Matching)是将每一个字符与保存有标准字体和字号位图的文件进行不严格的比较。如果应用程序中有一个已保存字符的大数据库,则应用程序会选取合适的字符进行正确的匹配。软十大网投平台信誉排行榜件必须使用一些处理技术,找出最相似的匹配,通常是不断试验同一个字符的不同版本来比较。有些软件可以扫描一页文本,并鉴别出定义新字体的每一个字符。有些软件则使用自己的识别技术,尽其所能鉴别页面上的字符,然后将不可识别的字符进行人工选择或直接录入。

    特征提取识别法(Feature Extraction)是将每个字符分解为很多个不同的字符特征,包括斜线、水平线和曲线等。然后,又将这些特征与理解(识别)的字符进行匹配。举个简单的例子,应用程序识别到两条水平横线,它就会“认为”该字符可能是“二”。特征提取法的优点是可以识别多种字体,例如中文书法体就是采用特征提取法实现字符识别的。

    多数OCR应用软件都加入了语法智能检查功能,这种功能进一步提高了识别率。它主要通过上下文检查法实现拼写和语法的纠正,在文字识别时,OCR应用程序会做多次的上下文衔接性检查,根据程序中已经存在的词组、固定的用词顺序,对应的检查字符串的用词字。比较高级的应用软件会自动用它“认为”正确的词语替换错误词语,纠正语句意思。

    中安未来护照阅读机是一款功能丰富、设计新颖的证件信息采集设备,涉及光学、机械、电子电路、图像处理、模式识别、OCR识别、人工智能、射频识别(RFID)等多项领域;它配备500万像素,采用TH-OCR技术,能够快速、准确读出符合国际民航组织标准ICAO DOC 9303设计的本式或卡式电子芯片信息,如机读电子护照、电子港奥居民来往内地通行证、电子大陆居民前往台湾通行证等多种旅行证件。

    可选配国内二代证读卡器,扩大应用领域。支持证件自动感应触发,自动分类,操作简单方便,非常适合在酒店、边防检查站、通关口岸、海关、机场、出入境管理局、涉外旅行社等场所应用。

    返回搜狐,查看更多

    责任编辑:

    展开全部收起
    
    留言专区
    热门评论
    • 陈渲洋 12月02日 06:52

      U乐国际官网登录:中医在泰国:健康“一家亲”- 世界同心圆09-_中国政协_中国

    • 孙子涵 12月02日 15:44

      黄金城hjc037vip:职场女性买哪款笔记本?从颜值设计和性能需求出发,我推荐这一款

    • 尤韵荔 12月02日 11:32

      188金宝搏官方app下载查封了嘛:连环画传颂千年运河 “咱家书房”助力运河原创品牌更亲民-运河品牌+01期-_中国政协_中国

    • 仝飞光 12月02日 16:20

      金宝搏网页登录:丁磊发布公开信:网易云音乐不止做音乐,还要经营声音的生意-科技频道

    • 阳惊骅 12月02日 22:39

      千赢国际网址是多少:原创- 比赛日:莱斯特2-2圣徒 那不勒斯遭绝平2-2萨索洛_0