平台实验PLATFORM
熟悉平台整体架构与各模块联动逻辑,能独立完成从设备调试到完整场景应用的全流程操作,理解人工智能实训平台在智慧工厂中的应用价值。
实验准备 PREPARATION
本节启动设备程序,让学生开始使用完整的实验。学生启动PC主机后需要完成各个模块的测试,以确保各个模块(警报器、摄像头)是正常使用的。之后再完成完整的设备启动程序。
PaddleOCR识别
PaddleOCR是飞桨首次开源文字识别模型套件,目标是打造丰富、领先、实用的文本识别模型/工具库。最新开源的超轻量PP-OCRv3模型大小仅为16.2M。同时支持中英文识别;支持倾斜、竖排等多种方向文字识别;支持GPU、CPU预测;用户既可以通过PaddleHub很便捷的直接使用该超轻量模型,也可以使用PaddleOCR开源套件训练自己的超轻量模型。在本设备中已安装并调试好PaddleOCR。
使用PaddleOCR 库对可以指定图像中的文本进行识别,并将识别出的文本打印出来。使用方法如下ocr.py代码:
from paddleocr import PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, show_log=False, use_gpu=True, lang="en")
img_path = 'img.png'
result = ocr.ocr(img_path, cls=True)
for line in result[0]:
print(line)
形参配置
运行程序,使用argparse可以方便传入和修改参数,提高程序的易用性、灵活性和可维护性。打开主代码抓取异样编码.py。如下图所示,为Pycharm中为抓取异样编码.py配置形参的步骤:鼠标右键后,选择「修改运行配置」。
在配置窗口界面中,形参选项框输入每个警报器和摄像头的编号。具体每个参数输入的数据可以参考以下几节。
同理,在抓取指定编码.py中也需要进行相同的操作。
具体参数详解如下:
1)SERIAL_PORT1~2:表示2个报警器对应的串口号,需要通过调试确定对应串口号。
2)confid_level:识别结果的置信度,过滤因操作台抖动等因素导致识别错误的情况(有大幅度运动画面的置信度偏低),默认为0.9。
3)cap_numb 1~2:摄像头编号,1、2的顺序必须要准确。经过调试后确定。
4)frame_delay:获取画面帧数的延时,例如200代表每200ms获取一张图片,即1秒5张图片。传送带速度过快时可适当减少该延时。默认为200。
5)ip:装有机械臂配置文件虚拟机的IP地址。
6)grab_latency:从触发抓取到实际机械臂抓取动作之间的延迟时间。
远程启动服务器
主要目的是自动化地在远程服务器上启动并执行一个Jupyter Notebook文件。具体来说,它通过SSH连接到远程服务器,然后使用Jupyter Notebook的命令行工具nbconvert来执行指定的.ipynb文件。这个过程不需要用户手动打开浏览器或与Jupyter Notebook服务器进行交互,一切都在后台自动完成,具体内容见zhua.py代码。
