所有文章 > 正文

CVPR 2021 | PRTR:基于级联Transformer的人体姿态估计

作者: CVer计算机视觉

浏览量: 1327

时间: 2021-05-17 10:31

关键词: PR,人体姿态,估计,视觉,方法,交流,回归,微信公众,注意力,论文

这才是第一个基于Transformer的人体姿态估计网络(至少早于之前公开的论文)!基于DETR修改,属于基于回归方法的阵营,代码即将开源!

这才是第一个基于Transformer的人体姿态估计网络(至少早于之前公开的论文)!基于DETR修改,属于基于回归方法的阵营,代码即将开源!

想看更多CVPR 2021论文和开源项目可以点击:
CVPR2021-Papers-with-CodePose Recognition with Cascade Transformers

作者单位:国科大, 清华, UCSD
代码:https://github.com/mlpc-ucsd/PRTR
论文:https://www.aminer.org/pub/607841c091e011f5ecc9dd96/pose-recognition-with-cascade-transformers
在本文中,我们提出了一种使用级联Transformer的基于回归的姿势识别方法。

在该领域中对现有方法进行分类的一种方法是将它们分为:
1)基于热图(heatmap-based)
2)基于回归(regression-based)
通常,基于热图的方法可实现较高的精度,但会受到各种启发式设计的影响(大多数情况下不是端到端的),而基于回归的方法则具有相对较低的精度,但它们的中间不可微步骤较少。
在这里,我们利用Transformers中的编码器-解码器结构来执行基于回归的行人和关键点检测,该检测是通用的,与现有方法相比,它需要较少的启发式设计。 我们展示了跨不同自注意力层的关键点假设(查询)细化过程,以揭示Transformer中的递归自注意力机制。
两阶段PRTR变体:

端到端PETR变体:

实验结果
在实验中,与基于竞争的回归方法相比,我们报告了姿势识别的竞争结果。

扫码微信阅读
[关于转载]:本文转载于CVer计算机视觉,仅用于学术分享,有任何问题请与我们联系:report@aminer.cn。