在英特尔开发套件上用OpenVINO加速YOLOv8-seg实例分割模型
在英特尔开发套件上用OpenVINO加速YOLOv8目标检测模型》介绍了在英特尔开发套件上使用OpenVINO™ 开发套件部署并测评YOLOv8的目标检测模型,本文将介绍在英特尔开发套件上使用OpenVINO™加速YOLOv8-seg实例分割模型。请先下载本文的范例代码仓,并搭建好YOLOv8的OpenVINO推理程序开发环境。1.2 导出YOLOv8-seg 实例分割OpenVINO IR模型Y
作者:英特尔物联网行业创新大使 杨雪锋
本案例适用于x86以上英特尔平台
目录
1.2 导出YOLOv8-seg 实例分割OpenVINO IR模型
1.3 用benchmark_app测试YOLOv8-seg实例分割模型的推理计算性能
1.4 使用OpenVINO Python 编写YOLOv8-seg实例分割模型推理程序
1.1 简介
《在英特尔开发套件上用OpenVINO加速YOLOv8目标检测模型》介绍了在英特尔开发套件上使用OpenVINO™ 开发套件部署并测评YOLOv8的目标检测模型,本文将介绍在英特尔开发套件上使用OpenVINO™加速YOLOv8-seg实例分割模型。
请先下载本文的范例代码仓,并搭建好YOLOv8的OpenVINO推理程序开发环境。
git clone https://gitee.com/ppov-nuc/yolov8_openvino.git
1.2 导出YOLOv8-seg 实例分割OpenVINO IR模型
YOLOv8-seg的实例分割模型有5种,在COCO数据集完成训练,如下表所示。
首先使用命令:yolo export model=yolov8n-seg.pt format=onnx,完成yolov8n-seg.onnx模型导出,如下图所示。
然后使用命令:mo -m yolov8n-seg.onnx --compress_to_fp16,优化并导出FP16精度的OpenVINO IR格式模型,如下图所示。
1.3 用benchmark_app测试YOLOv8-seg实例分割模型的推理计算性能
benchmark_app是OpenVINOTM工具套件自带的AI模型推理计算性能测试工具,可以指定在不同的计算设备上,在同步或异步模式下,测试出不带前后处理的纯AI模型推理计算性能。
使用命令:benchmark_app -m yolov8n-seg.xml -d GPU,获得yolov8n-seg.xml模型在英特尔开发套件的集成显卡上的异步推理计算性能,如下图所示。
1.4 使用OpenVINO Python 编写YOLOv8-seg实例分割模型推理程序
用Netron打开yolov8n-seg.onnx可以看到模型的输入和输出,跟YOLOv5-seg模型的输入输出定义很类似:
- 输入节点名字:“images”;数据: float32[1,3,640,640]
- 输出节点1的名字:“output0”;数据:float32[1,116,8400]。其中116的前84个字段跟 YOLOv8目标检测模型输出定义完全一致,即cx,cy,w,h和80类的分数;后32个字段用于计算掩膜数据。
- 输出节点2的名字:“output1”;数据:float32[1,32,160,160]。output0后32个字段与output1的数据做矩阵乘法后得到的结果,即为对应目标的掩膜数据。
基于OpenVINO Python API的YOLOv8-seg实例分割模型范例程序yolov8_seg_ov_sync_infer_demo.py的核心源代码,如下所示:
# Initialize the VideoCapture
cap = cv2.VideoCapture("store-aisle-detection.mp4")
# Initialize YOLOv5 Instance Segmentator
model_path = "yolov8n-seg.xml"
device_name = "GPU"
yoloseg = YOLOSeg(model_path, device_name, conf_thres=0.3, iou_thres=0.3)
while cap.isOpened():
# Read frame from the video
ret, frame = cap.read()
if not ret:
break
# Update object localizer
start = time.time()
boxes, scores, class_ids, masks = yoloseg(frame)
# postprocess and draw masks
combined_img = yoloseg.draw_masks(frame)
end = time.time()
# show FPS
fps = (1 / (end - start))
fps_label = "Throughput: %.2f FPS" % fps
cv2.putText(combined_img, fps_label, (10, 25), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)
# show ALL
cv2.imshow("YOLOv8 Segmentation OpenVINO inference Demo", combined_img)
# Press Any key stop
if cv2.waitKey(1) > -1:
print("finished by user")
break
运行结果,如下图所示:
1.5 结论
英特尔开发套件借助N5105处理器的集成显卡(24个执行单元)和OpenVINO,可以在YOLOv8-seg的实例分割模型上获得相当不错的性能。通过异步处理和AsyncInferQueue,还能进一步提升计算设备的利用率,提高AI推理程序的吞吐量。下一篇将继续介绍在《在英特尔开发套件上用OpenVINO加速YOLOv8-pose姿态检测模型》。
更多推荐
所有评论(0)