CVPR 2021 | PRTR：基于级联Transformer的人体姿态估计 - 热点 - 科研解读

CVPR 2021 | PRTR：基于级联Transformer的人体姿态估计

作者: CVer计算机视觉

浏览量: 1327

时间: 2021-05-17 10:31

关键词: PR，人体姿态，估计，视觉，方法，交流，回归，微信公众，注意力，论文

这才是第一个基于Transformer的人体姿态估计网络（至少早于之前公开的论文）！基于DETR修改，属于基于回归方法的阵营，代码即将开源！

想看更多CVPR 2021论文和开源项目可以点击：
CVPR2021-Papers-with-CodePose Recognition with Cascade Transformers

作者单位：国科大, 清华, UCSD
代码：https://github.com/mlpc-ucsd/PRTR
论文：https://www.aminer.org/pub/607841c091e011f5ecc9dd96/pose-recognition-with-cascade-transformers
在本文中，我们提出了一种使用级联Transformer的基于回归的姿势识别方法。

在该领域中对现有方法进行分类的一种方法是将它们分为:
1）基于热图（heatmap-based）
2）基于回归（regression-based）
通常，基于热图的方法可实现较高的精度，但会受到各种启发式设计的影响（大多数情况下不是端到端的），而基于回归的方法则具有相对较低的精度，但它们的中间不可微步骤较少。
在这里，我们利用Transformers中的编码器-解码器结构来执行基于回归的行人和关键点检测，该检测是通用的，与现有方法相比，它需要较少的启发式设计。我们展示了跨不同自注意力层的关键点假设（查询）细化过程，以揭示Transformer中的递归自注意力机制。
两阶段PRTR变体：