yolov11_deploymethods

由于涉及量化、部署两个领域，难免有不对之处，欢迎指正。

本仓库对 yolov11（yolov8）尝试了7种不同的部署方法，在最基础的模型上一步一步的去掉解码相关的操作（移到后处理种进行），直到不能再删减，保留到模型最本质的部分。

随着解码相关的操作越来越多的移入后处理，模型的推理的时耗在减少，后处理的时耗在增加；但也随着解码操作从模型种移除，量化的效果也在逐步变好。

对每种方法的优势进行了简单总结，不同的平台、不同的时耗或CPU占用需求，总有一种方法是适用的。当然对想了解部署的也是一个很好的参考学习资料。

春节期间一天一种部署方法，这个春节收获满满。

yolov11的7种部署方法代码链接

本仓库种使用的板端芯片rk3588，模型yolov11n，模型输入分辨率640x640，检测类别80类。

0 七种方法汇总

编号	推理时耗ms	后处理时耗ms	总时耗ms	CPU占用相比上一种方法	int8量化友好性
第1种	--	--	最少	最简单	不友好
第2种	33.75	4.4972	38.2472	同1	不友好
第3种	32.44	4.4971	36.4971	增多	不友好
第4种	30.78	4.55	35.33	增多	较友好
第5种	30.75	4.84	35.58	增多，增加到最多	较友好
第6种	30.24	7.08	37.32	同5	较友好
第7种	30.17	7.34	37.51	同5	友好

若NPU负载不是瓶颈，当然可以考虑把多的操作放在NPU上，反之将操作往CPU上挪一部分；若量化掉点较多，则可以考虑量化稍微友好的方式。

1 代码目录结构

yolov11_onnx  # onnx 推理脚本、模型、测试图片、测试效果图
yolov11_rknn  # 转并推理 rknn 脚本、模型、测试图片、测试效果图
yolov11_cpp   # 部署 rk388 完整 C++ 代码、模型、测试图片、测试效果图

2 yolov11（v8）的7种部署方法

2.1 第1种部署方法

模型结构

按照yolov11官方导出的onnx模型，模型输出直接是类别和解码后的框，模型结构如下图。

onnx效果

很遗憾的是转换成rknn的int8模型，检测不到任何结果。转换rknn的int8时把模型输出结果都打印出来发现，模型输出的84这个维度，前4个坐标框值正常，后80个得分输出全为0。导致这样的原因：坐标框值取值范围是1-640，而得分输出的值取值范围0-1，使得对量化很不友好，导致模型得分输出的值基本都为0。尝试转rknn的时不进行量化结果输出正常。因此该方法对量化不友好。这种部署方式模型时耗最长，后处理操作最少。

板端效果

由于该种部署方法转rknn的int8时量化效果非常差，因此不做板端部署。

2.2 第2种部署方法

模型结构

在第1种部署方法的模型基础上，去掉了最后的把坐标框和得分concat在一起的操作。

onnx效果

onnx的测试效果和第一种一样，就不再贴图了。

板端效果

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
yolov11_cpp		yolov11_cpp
yolov11_onnx		yolov11_onnx
yolov11_rknn		yolov11_rknn
README.md		README.md

cqu20160901/yolov11_deploymethods

Folders and files

Latest commit

History

Repository files navigation

yolov11_deploymethods

0 七种方法汇总

1 代码目录结构

2 yolov11（v8）的7种部署方法

2.1 第1种部署方法

模型结构

onnx效果

板端效果

2.2 第2种部署方法

模型结构

onnx效果

板端效果

板端时耗

2.3 第3种部署方法

模型结构

onnx效果

板端效果

板端时耗

2.4 第4种部署方法

模型结构

onnx效果

板端效果

板端时耗

2.5 第5种部署方法

模型结构

onnx效果

板端效果

板端时耗

2.6 第6种部署方法

模型结构

onnx效果

板端效果

板端时耗

2.7 第7种部署方法

模型结构

onnx效果

板端效果

板端时耗

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages