微软亚洲研究院资深研究员王井东做科学前沿报告会 ——面向视觉识别的高分辨率表征学习

2019年9月27日,微软亚洲研究院王井东研究员受中国科学院大学电子电气与通信工程学院模式识别与系统开发实验室叶齐祥教授的邀请,于国科大雁栖湖校区办公楼118会议室为同学们做了“面向视觉识别的高分辨率表征学习”的专题报告。

图1 微软亚洲研究院王井东研究员报告

王老师指出,对于视觉任务中图像级任务,以往常见的神经网络如vgg、resnet等通常具有很好的表现,但是由于网络下采样损失部分信息导致其学到的表征分辨率较低,在区域层次和像素层次的问题中,恢复高分辨率表征空间的区分度不够强,很难完全恢复高分辨率特征信息。为此,王老师团队提出了一种高分辨率深度神经网络(HRNet)。这种网络相对于传统的网络架构,没有采取先卷积下采到低分辨率再恢复为高分辨率的方法,取而代之的采用并行的网络结构将高中低分辨率信息都保留,增强网络中不同分辨率的交互,减少信息损失。

图2 HRnet网络结构

王老师在介绍完网络结构之后,就网络中的细节以及实验展开详细介绍。HRnet在视觉的Pose estimation、Semantic segmentation、Image classification、object detection等任务中性能表现突出,在多项任务中评测位居第一(state of art)。

在报告结束后,同学们针对自己感兴趣的部分提问,和王老师互动。部分同学就高分辨率表征网络的发展方向、网络的计算量以及空间复杂度和王老师展开讨论,也有同学就微软的实习工作、和出国交流工作的机会提问,王老师一一为同学们讲解。

报告会最后,叶齐祥教授总结,HRnet不同于FPN、PSPnet等网络,作为一个并行保持分辨率的网络结构,是一个开创性的工作。我们在以后的工作中应当多思考,多创新,向好的工作学习。

图3 报告会现场