[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用

2023-10-16 17:28:27
阅读：96次

1..... 应用概述... 2

2..... 免费下载试用... 2

3..... 视频介绍... 2

4..... iNeuLink.Ocr图像数据采集应用... 2

5..... 数据上传到iNeuOS工业互联网操作系统... 4

6..... Ocr基本概念... 7

1. 应用概述

　　在工业、军工或航天等领域，有些设备及软件系统比较陈旧，但是更换的成本比较高，在实验或生产过程中不能够完整的记录数据，给数据应用和分析造成了很大的障碍，更无法解决实验和生产人员的劳动强度。

　　通过OCR图像识别的技术可以很好的解决上述问题，但是没有一个完整的产品化的软件实现操作级应用。尽管OCR技术相对比较成熟，除特定应用场景使用外，普及使用率并不高。

　　iNeuKernel.Ocr图像数据采集软件，实现了实时自动获得屏幕截图或是应用程序截图、动态增加数据识别标签信息、后台任务自动切片采集数据以及实时转发数据，与iNeuOS工业互联网操作系统互联互通，完整数据采集、传输、存储、视图建模、分析等应用过程。示意如下图：

2. 免费下载试用

　　链接：https://pan.baidu.com/s/1joGfBefaBKiFJ1l08N3KZg

　　提取码：v242

3. 视频介绍

　　视频介绍：iNeuKernel.Ocr 图像数据识别与采集

4. iNeuLink.Ocr图像数据采集应用

（1）运行的主界面，应用相对简单。如下图：

（2）配置图源，可以使用快捷键，全屏截图或是程序截图，以便定位数据标签的坐标的相对位置，进行数据提取。如下图：

（3）增加或编辑识别标签，单击【数据识别】可以用红色方框在图源上标注要误别的数据位置信息，在【数据识别结果】中可以看到识别数据的结果，并且填写数据标签名称。如下图：

（4）转发数据，可以把识别的数据结果转发给其他系统，填写站点编号、远程IP、远程Port转发周期和是否启用等信息。如下图:

5. 数据上传到iNeuOS工业互联网操作系统

　　下载iNeuOS离线安装包，安装过程参见：一键部署。进入系统后，选择桌面【设备模型】，单击左上角小加号图标，增加一个新的设备。选择【服务实例】后面的【编辑】按钮链接，配置【基本设置】和【Socket】，【Socket】默认侦听端口为6699，其他信息一般不需要修改，如下图：

选择配置好的【服务实例】，并且配置通讯类型、应用协议和选择驱动等，配置如下图：

选择左上角旋转图标，会重新启动后台服务，应用当前配置好的信息。硬件网关与iNeuOS平台第一次通信时会同步网关的设备和数据点信息，会在当前iNeuOS设备驱动下生成子设备，在子设备上会有iNeuKernel硬件网关的数据点信息。如下图：

　　 iNeuOS工业互联网试用：试用地址

6. Ocr基本概念

（1）OCR的应用场景

　　根据OCR的应用场景而言，我们可以大致分成识别特定场景下的专用OCR以及识别多种场景下的通用OCR。就前者而言，证件识别以及车牌识别就是专用OCR的典型案例。针对特定场景进行设计、优化以达到最好的特定场景下的效果展示。那通用的OCR就是使用在更多、更复杂的场景下，拥有比较好的泛性。在这个过程中由于场景的不确定性，比如：图片背景极其丰富、亮度不均衡、光照不均衡、残缺遮挡、文字扭曲、字体多样等等问题，会带来极大的挑战。

（2）OCR的技术路线

　　典型的OCR技术路线如下图所示：

　　其中OCR识别的关键路径在于文字检测和文本识别部分，这也是深度学习技术可以充分发挥功效的地方。PaddleHub为大家开源的预训练模型的网络结构是Differentiable Binarization+ CRNN，基于icdar2015数据集下进行的训练。

　　首先，DB是一种基于分割的文本检测算法。在各种文本检测算法中，基于分割的检测算法可以更好地处理弯曲等不规则形状文本，因此往往能取得更好的检测效果。但分割法后处理步骤中将分割结果转化为检测框的流程复杂，耗时严重。因此作者提出一个可微的二值化模块（Differentiable Binarization，简称DB），将二值化阈值加入训练中学习，可以获得更准确的检测边界，从而简化后处理流程。DB算法最终在5个数据集上达到了state-of-art的效果和性能。参考论文：Real-time Scene Text Detection with Differentiable Binarization

　　下图是DB算法的结构图：

　　接着，我们使用 CRNN（Convolutional Recurrent Neural Network）即卷积递归神经网络，是DCNN和RNN的组合，专门用于识别图像中的序列式对象。与CTC loss配合使用，进行文字识别，可以直接从文本词级或行级的标注中学习，不需要详细的字符级的标注。参考论文:An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition

　　下图是CRNN的网络结构图：

物联网&大数据技术 QQ群：54256083
物联网&大数据项目 QQ群：727664080
QQ：504547114
微信：wxzz0151
博客：https://www.cnblogs.com/lsjwq
微信公众号：iNeuOS

本页链接：http://www.shenfuxuetang.com/article/detail/4834