在近期公布的2021年“国际计算机视觉大会”国际顶级会议(ICCV 2021)论文录用名单中,计算机学院杨鑫教授团队的2项研究成果被大会接收。ICCV是计算机学科普遍认可的计算机视觉领域顶级国际会议,被中国计算机学会(CCF)列为A类会议,今年论文录用率为26%左右,该会议将于10月11日-17日举办。根据当前流行的Google Scholar Citation统计,ICCV排在所有学科目录第31位。
博士生张吉庆作为第一作者与硕士生傅应锴等人共同完成的研究成果“Object Tracking by Jointly Exploiting Frame and Event Domain”致力于解决有挑战场景下的目标跟踪问题。对于运动目标而言,其运动的场景复杂并且经常发生变化,或是目标本身也会不断变化。那么如何在复杂场景中识别并跟踪不断变化的目标就成为一个挑战性的任务。当前存在的目标跟踪算法在低光照、高动态范围和快速运动等困难场景下可能会发生失效,针对该问题,团队创新性地引入仿生式相机--事件相机,首次将事件相机与传统相机进行结合解决困难场景的跟踪失效问题[1],为后续研究提供借鉴与帮助。本文首次引入了真实事件相机数据来帮助提升传统目标跟踪算法的准确性和鲁棒性,设计的基于帧图像信息和事件信息融合的深度神经网络模型能够大幅度提升目标跟踪在低光照、高动态范围和快速运动等困难场景下的准确率。此项研究成果具有广泛的应用价值,所提出的融合目标跟踪方法有助于在推动目标跟踪技术在军事和民用方面的使用, 尤其是在具有挑战、困难的场景下,军事方面包括无人飞行器、精确制导、空中预警、战场监视等;民用方面包括移动机器人、智能视频监控、智能交通系统等。
硕士生刘宇豪作为第一作者与博士生乔羽等人共同完成的研究成果“Tripartite Information Mining and Integration for Image Matting”致力于解决自然真实场景中的图像抠图问题。图像抠图旨在从一幅图像精细地抠取出用户感兴趣的目标物体,比如人、玻璃杯、动物等等。该任务是一个极具有挑战的任务,相比于semantic segmentation这种求解像素的分类问题,抠图所要求解的是逐像素的离散值,本质上是一个回归问题,因此需要辅助的三分图约束信息来便利求解。当前求解的方法均采用输入图像和约束信息一同送入网络使用卷机神经网络进行隐式的求解,虽然可以取得不错的效果,但是由于卷机神经网络局部连接的特性导致过多地关注于局部信息,从而忽略了全局信息的挖掘和利用。在本文中,我们提出一种三分信息挖掘和融合的方法,通过两个辅助全局信息挖掘模块来补足原有长远信息的不足,进而自适应地融合全局和局部信息。该方法在三个通用的评测数据集上都取得了最好的效果,下图为先前最好的方法和我们方法的对比示例图。近年来,团队针对图像智能抠图任务,围绕交互式主动抠图[2,3]、无约束的端化抠图[4,5]、基于辅助信息的抠图[6,7]等方面做了一系列的探索研究,所提出的一系列方法具有较高的实际应用场景,可以应用于影视行业的特效制作、绿幕成像、图像合成与编辑、直播等。
详见:http://faculty.
[1]. Multi-domain Collaborative Feature Representation for Robust Visual Object Tracking. CGI 2021.
[2]. Active matting. NIPS 2018.
[3]. Smart Scribbles for Image Matting. ACM Transactions on Multimedia Computing, Communications, and Applications 2021.
[4]. Attention-Guided Hierarchical Structure Aggregation for Image Matting. CVPR 2020.
[5]. Multi-scale Information Assembly for Image Matting. PG 2020.
[6]. Prior-Induced Information Alignment for Image Matting. IEEE Transactions on Multimedia 2021.
[7]. Tripartite Information Mining and Integration for Image Matting. ICCV 2021.