使用爱芯派Pro开发板部署人体姿态估计模型-电子发烧友网

在经过之前对于开发板的使用，以及通过几个爱芯派官方给出的示例demo（mobilenet/yolov5）在开发板上的部署之后，笔者也逐渐了解了爱芯派这块开发板利用其官方的推理引擎和pipeline部署模型的整体架构。接下来就回到最开始定的主线上了——人体姿态估计。这篇文章就是记录对一些轻量化人体姿态估计模型的调研，和前期准备。

01人体姿态估计任务介绍

其实姿态任务识别在很多生活场景都被使用到，这里给大家举几个例子：

虚拟主播：大家看到B站直播时的“皮套人”，通常通过一个2D live的形象展示一个动漫形象，然后和主播同步动作。这就是通过摄像头识别当前主播姿态，再同步到虚拟形象上实现的。

VR游戏：大家可能用过像kinect这样的设备，用于VR体感游戏。kinect同样会识别当前用户的姿态，然后用于VR交互中。

活动识别：通过得到人体姿态后，再通过一个简单的分类器，可以得到当前的运动状态，如用户是否跌倒（可以帮助监控老年人），以及用户当前身体状态等。

02人体姿态估计任务技术路线

其实人体姿态估计任务已经有很久的年头了，在当前也算是很成熟的任务了。有兴趣的朋友可以阅读下这篇综述：Deep Learning-Based Human Pose Estimation: A Survey (arxiv.org)。下面简单的对单人、多人人体姿态估计的技术路线做个小介绍：

03Openpose/lightweight openpose模型

首先要用到的是Openpose模型，这应该是最有名的人体姿态估计的模型了，因为是首个开源的人体姿态估计框架。论文如下：1812.08008.pdf (arxiv.org)。如下图所示，openpose能在多人情况下达到理想的识别效果。这里简单说明一下openpose的原理：openpose就是原来的Bottom-up模型，会先生成针对关键点的heatmap图像，来预测关键点的位置；同时也会PAF图像，也叫做关节的亲和力场，哪些关节的亲和力大，那么把它们划分为同一个人。比如一个胳膊对应两个关节点。

Openpose存在的一个问题便它其实是于比较大的模型，在GPU上运行速度也只是勉强实时。为了部署在端侧，使用较低算力的设备，我们需要进一步将其轻量化，也就是lightweight openpose项目。这个主要针对Openpose模型做一些改进，参数量下降为15% ，但是性能缺相差无几（精度降低1%）。这里不细讲了，有兴趣的朋友可以看这篇文章：轻量级OpenPose， Lightweight OpenPose

针对其部署，笔者使用了一些开源的项目后，发现如下的项目比较好用，就先用其观察模型的效果：

git clone https://github.com/Hzzone/pytorch-openpose.git

（左右移动查看全部内容）

在其body.py里面可以简单的写一段代码输出onnx文件观察网络结构：

class Body(object):
  def __init__(self, model_path):
    self.model = bodypose_model()
    if torch.cuda.is_available():
      self.model = self.model.cuda()
    model_dict = util.transfer(self.model, torch.load(model_path))
    self.model.load_state_dict(model_dict)
    self.model.eval()


    dummy_input = torch.randn(1, 3, 368, 368).cuda()
    torch.onnx.export(self.model, dummy_input, "model/openpose_lightweight_body.onnx")

（左右移动查看全部内容）

Openpose模型最终会输出了两个特征图heat_map和paf_map，shape分别为（height，width，19）和（height，width，38），其中width、height分别为输入图片的宽高/8，其实是由于最开始会通过一个VGG网络提取特征，得到输入图片的宽高/8的特征图。19表示coco数据集的关节种类个数18（即一个人体的所有关节点）+1个背景类别，38表示由这18个关节点构成的肢体的部分亲和力场（每个肢体由两个关节连接组成）。如下图所示，把导出来的onnx文件放到netron网站可以看到其具体结构。这里可以看到输出的shape，也方便我们部署的要求。

04Movenet

除了Openpose外，笔者还有一个选型，就是谷歌的轻量级人体姿态估计模型MoveNet。它是更近的一个轻量级人体姿态估计模型，但是一个缺点是它没有论文，也没有官方代码，虽然有开源的tfjs模型还有tflite模型，但是也只能通过观察模型结构去反推。

movenent的介绍在这个网站：Next-Generation Pose Detection with MoveNet and TensorFlow.js — The TensorFlow Blog ，通过对其学习，以及利用官方模型转换到onnx模型，打开到netron网站观察其结构，可以发现其有四个输出，分别对应预测人体实例的几何中、预测人体的全部关键点集、预测所有关键点的位置的热力场、以及预测关键点2D偏移场，也就是每个关键点精确子像素位置的局部偏移。这与Openpose不同，但是有了更精细话的结果。

同样为了复刻movenet网络结构，笔者选择参照如下的项目进行实现。

git clone https://github.com/fire717/movenet.pytorch.git

（左右移动查看全部内容）

后续笔者先尝试将openpose/lightweight openpose部署在板子上，再尝试对movenent进行进一步的优化。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
5099

浏览量
134461
开发板

开发板

+关注

关注
25

文章
6122

浏览量
113332
模型

模型

+关注

关注
1

文章
3648

浏览量
51712
vr

vr

+关注

关注
34

文章
9692

浏览量
156590
爱芯派

爱芯派

+关注

关注
0

文章
3

浏览量
208

原文标题：如何用爱芯派 Pro 开发板来部署人体姿态估计模型

文章出处：【微信号：gh_9b9470648b3c，微信公众号：电子发烧友论坛】欢迎添加关注！文章转载请注明出处。

搜索历史

使用爱芯派Pro开发板部署人体姿态估计模型

评论