近期,译图智讯凭借多年的自主研发和技术创新能力,再次优化升级了移动端深度学习OCR,在更多的产品中成功落地应用,并支持快速定制开发,将有效规避传统OCR识别的不足,为用户带去更高性能的体验。

OCR技术跨越式升级,深度学习移动端部署大有可为
深度学习算法的应用使OCR识别技术得到了一次跨越式的升级,整体提升了OCR的识别率与识别速度。深度学习OCR借助神经网络可模仿人脑机制对图像、文本等数据进行分析,可以更加可靠、快速地完成海量样本的训练,得到近似专家能力的最优模型,同时在低质量图像、生僻字、非均匀背景、多语言混合等复杂场景中实现了高效精准的识别与分类。
但是复杂模型的同时,带来了高额的存储空间、计算资源消耗问题,使其需要强大的算力支撑,很难落实到各个硬件平台,而如今众多的手机芯片,大多数基于ARM结构,相比服务端算力有限,所以移动端OCR算法多以牺牲一定的精度获取运行速度,轻量化网络,深度学习的移动端部署已成为重要的发展方向。

轻量OCR模型,从服务器端到移动端
移动端模型优化需要在保持精度的同时,进行模型体积压缩和运算量压缩,移动端深度学习将神经网络(CNN+RNN+LSTM)强大的自动编码能力压缩到了手机能接受的程度,可以在10M左右的内存环境,呈现高精度、高速度的识别效果。
相比于传统OCR,在识别精度与速度上,深度学习OCR遥遥领先。以银行卡识别为例,深度学习移动端可适用于对焦不准、高噪声、低分辨率、强光影等复杂背景的图像识别,准确率提升10个点以上,同时识别速度变为原来的二分之一。
在证件分割中,深度学习网络可高效地学习到边缘情况,通过边缘检测,得到物体的边缘轮廓,然后通过边缘跟踪合并,得到证件信息,保障识别效果。
在目标检测中,可在杂乱无序、千奇百怪的复杂场景中准确定位出主方向角度、直线、图章、文字等区域;面对缺边缺角、光斑、形变、遮挡等异常图像情况可做出提示。

快速定制化服务,为更多场景赋能
一直以来,移动端都有极大的市场需求,在银行开户、投保理赔、信贷、证券开户、汽车金融等众多场景中,都具有大量的卡证识别需求,并且用户包容性小、对体验感要求较高,更加注重产品的识别精度与速度。
译图智讯基于深度学习的移动端OCR识别,具有识别准确率更高、速度更快、无格式依赖、支持私有化快速部署等优势,同时配合其他技术,使其具备多任务检测、整行识别、图像分割定位和分类等功能,可满足更复杂、更高要求的任务需求,满足快速定制化服务需求。
移动端的高效任务部署,需要从模型、计算、设备三方面进行优化,其中深度学习算法和模型构建是OCR识别应用的关键。译图智讯通过数学推导和不断学习达成的最优模型,拥有更强大的解决问题能力,加上机器端到端的不间断处理使得整个生产可以不停运转,高效学习能力+高效注意力,使得其比传统OCR拥有超过数倍的识别、检测、分析能力。
从服务器端到移动端,译图智讯一直致力于人工智能领域的深度研究与开发,以技术突破作为基础,不断细化业务需求,强化更多识别模块,促进了业务模式的创新升级。未来,译图智讯会在行业中沉淀自我,持续输出AI技术服务能力,驱动行业的智能化升级。
评论留言