计算机科学与技术学院
学院新闻
当前位置: 首页>>学院新闻>>正文

 

 

计算机学院在人工智能顶级会议 AAAI 上发表最新研究成果
2021-12-14 08:57     (点击: )

近日,计算机学院杨鑫教授团队博士研究生乔羽、硕士研究生朱锦程、张泽耀与新松机器人公司的合作研究成果“CPRAL: Collaborative Panoptic-Regional Active Learning for Semantic Segmentation”在Association for the Advance of Artificial Intelligence (AAAI) 2022 上。国际先进人工智能协会(American Association for Artificial Intelligence)是人工智能领域的主要学术组织之一,AAAI是国际人工智能、机器学习领域的顶级会议,被中国计算机学会(CCF)认定为A类会议,今年大会的论文录取率又创新低,仅有15%。


现有的主动式学习语义分割模型主要可以分为两类,全景标签引导的方法以及区域信息监督的策略。前者直接选择图像进行标注,会有很多的冗余像素集,而后者则会迭代计算区域范围内的信息,需要累计巨大的计算量。两类方法在实际场景下的应用局限性,使得很多模型并不能得到很好的泛化效果。本工作提出了一种新的协同式全景区域主动学习框架(CPRAL)来解决语义分割任务,在提升模型训练精度的前提下,可以显著减少数据标注量与计算消耗。


本工作框架的输入是一个语义分割数据集,而输出是可以代表整个数据集的图像子集,然后在这个代表性子集上训练的模型可以实现在全部数据上训练的性能。具体来说,给定一个数据集以及一小批带有像素标注的初始采样图像,本工作首先对语义分割模型进行初始地训练,然后使用模型的全景信息从未标记的样本集中选择部分图像作为全景子集。针对分割数据集中的类别不平衡问题,本工作引入区域高斯注意模块(Regional Gaussian Attention module, RGA)实现语义偏置选择。全景子集以投票熵突出显示,然后加入高斯核来最大化偏置区域。本工作还提出了上下文标签扩展模块(Contextual Labels Extension, CLE),通过上下文注意力指导来增强区域标注。通过语义不可知的全局匹配和区域偏置选择与扩展的配合,本工作提出的CPRAL能够在标记工作量和性能之间取得平衡,并在不同规模的语义分布上实现兼顾。本工作在公开的城市街道数据集CityScapesBDD10K上进行了大量实验,结果表明所提出的CPRAL方法优于现有的前沿方法,用较小的样本标记比例取得了显著的结果。此外,本工作还设计了一个智能标注工具(Smart Segmentation Tool),通过超像素分割与区域交互结合的方式,可以为原生的场景数据提供高效的语义标注,这对于之后的语义分割相关任务也具有重要的意义。


本工作在优化语义分割模型性能的同时兼顾了数据采样与标注的效率,在无人驾驶、机器人等实际场景下有着较广的应用价值。本工作提出的主动式数据标注和语义分割框架可以从海量数据中筛选出最有代表性的场景图像及区域,然后由所提出的主动式标注工具进行快速而准确的标注;而由所选取出的代表性数据进行训练出来的模型,由于在数据选择时已由高斯核注意模块兼顾了类别平衡,而又有上下文标签扩展实现了标注信息的传播,使得模型具有较强的类别表达能力,能兼顾到大部分场景语义分布,这对于在复杂多变环境下无人驾驶和机器人进行深度学习的环境理解具有重要价值。





上一条:关于拟将孙亮同志转为中共正式党员的公示
下一条:计算机学院在计算机视觉顶级期刊 IJCV 上发表最新研究成果

地址:中国·辽宁省大连市甘井子区凌工路2号 邮编:116024
Copyright ? 2014 All Rights Reserved 版权所有:大连理工大学计算机科学与技术学院