OCR的分类
2020-08-16 14:21:31

大家知道什么是OCR吗?最通俗易懂的解释就是页面识别技术。如果要给OCR进行分类,我觉得可以分为两类:手写体识别和印刷体识别。

这两个可以认为是OCR领域两个大主题了,当然印刷体识别较手写体识别要简单得多,我们也能从直观上理解,印刷体大多都是规则的字体,因为这些字体都是计算机自己生成再通过打印技术印刷到纸上。在印刷体的识别上有其独特的干扰:在印刷过程中字体很可能变得断裂或者墨水粘连,使得OCR识别异常困难。当然这些都可以通过一些图像处理的技术帮他尽可能的还原,进而提高识别率。总的来说,单纯的印刷体识别在业界已经能做到很不错了,但说100%识别是肯定不可能的,但是说识别得不错那是没毛病。

印刷体已经识别得不错了,那么手写体呢?手写体识别一直是OCR界一直想攻克的难关,但是时至今天,感觉这个难关还没攻破,还有很多学者和公司在研究。为什么手写体识别这么难识别?因为人类手写的字往往带有个人特色,每个人写字的风格基本不一样,虽然人类可以读懂你写的文字,但是机器缺很难。那为什么机器能读懂印刷体?因为印刷体是机器造出来的啊,那机器当然能读懂自己造的字体啦哈哈~其实上面也提到了,印刷体一般都比较规则,字体都基本就那几十种,机器学习这几十种字体并不是一件难事,但是手写体,每个人都有一种字体的话,那机器该学习多少字体啊?这就是难度所在。

如果按识别的内容来分类,也就是按照识别的语言的分类的话,那么要识别的内容将是人类的所有语言(汉语、英语、德语、法语等)。如果仅按照我们国人的需求,那识别的内容就包括:汉字、英文字母、阿拉伯数字、常用标点符号。根据要识别的内容不同,识别的难度也各不相同。简单而言,识别数字是最简单了,毕竟要识别的字符只有0~9,而英文字母识别要识别的字符有26个(如果算上大小写的话那就52个),而中文识别,要识别的字符高达数千个(二级汉字一共6763个)!因为汉字的字形各不相同,结构非常复杂(比如带偏旁的汉字)如果要将这些字符都比较准确地识别出来,是一件相当具有挑战性的事情。但是,并不是所有应用都需要识别如此庞大的汉字集,比如车牌识别,我们的识别目标仅仅是数十个中国各省和直辖市的简称,难度就大大减少了。当然,在一些文档自动识别的应用是需要识别整个汉字集的,所以要保证识别的整体的识别还是很困难的。

在线AI智能系统摆脱了这些依赖,可以独立地在浏览器运行,更好的提高工作效率。目前光是OCR识别技术包含八大功能:图片文字提取、电子表格识别、手写字识别、驾驶证识别、营业执照识别·····。

文件OCR识别

可以直接上传文件,一秒钟就完成识别了。最厉害的还可以直接将图片链接检测进行识别,这办公效率简直没的说。

大家需要在在线AI系统中选择【文字在线识别】功能,就可以免费体验到了,快去把玩吧。

id: 11234
普通用户
会员专属权益
覆盖全站所有功能
超高精度语音识别和文字转换
支持中、外、方言等数十种语言类型
支持mp3、m4a等多种文件格式
支持沉稳男声、温柔女声等多种发音人
极速提取视频中声音和文字
支持多人配音合成
按次付费·10次
10
/张
点数终身有效
按次付费·10次
10
/张
点数终身有效
按次付费·10次
10
/张
点数终身有效
按次付费·10次
10
/张
点数终身有效
微信支付
支付宝支付
应付金额:
98.00
请使用微信/支付宝扫码支付
用户136****8012 10分钟前购买了 终身会员
用户139****7468 12分钟前购买了 终身会员
用户136****8012 10分钟前购买了 终身会员
用户156****9735 12分钟前购买了 终身会员
用户136****1765 9分钟前购买了 年度会员
用户159****5332 7分钟前购买了 年度会员
用户133****4888 5分钟前购买了 终身会员
购买须知
按次付费购买下载次数永久有效
开通任一会员,会员有效期内所有功能不限使用、不限次数
还在犹豫?先体验一下
¥
不限下载次数
扫码立即开通
扫码支付
放弃机会