在近期公布的2019年“计算机视觉与模式识别”国际顶级会议(CVPR 2019)论文录用名单中,计算机辅助设计国家地方工程实验室和人工智能研究中心团队魏小鹏教授、尹宝才教授、张强教授、杨鑫副教授、朴星霖博士的三项研究成果被大会接收。CVPR是计算机学科普遍认可的计算机视觉领域顶级国际会议,被中国计算机学会(CCF)列为A类会议,每年的论文录用率一般在20%左右。根据当前非常流行的Google Scholar Citation统计,CVPR的H5 index为158,排在所有学科目录35位(Nature第1位,Science第3位,Cell第6位),排在电信学科所有期刊和会议的第1位。此项研究成果的取得,标志着学部在计算机视觉与人工智能领域的持续创新与进步。今年,该会议将在美国洛杉矶举办。
与学生王天宇、许可、陈少喆共同完成的研究成果“Spatial Attentive Single-Image Deraining with a High Quality Real Rain Dataset”主要致力于解决单张图像上雨纹去除的问题。该论文提出了一个半自动的方法,利用雨纹在图像序列中的时空特性来生成高质量的无雨图像,以此构建含有两万九千五百对高分辨率雨图/无雨图的数据集。该数据集能够有效提升现有方法的去雨性能。与此同时该论文还设计了一个新的网络模型SPANet。它通过局部到全局的方式有效学习雨纹在四个方向上的空间特征并得到注意图,然后利用注意图来指引残差块去除图片中的雨纹。与目前现有的方法相比,本文方法能够有效提升单张图像的去雨性能。
值得一提的是,该文的第一作者为电信学部计算机科学与技术专业本科生王天宇,指导教师为杨鑫副教授。作为一名本科生,能将研究成果发表在领域顶级学术舞台上,在国内外都是比较少见的。电信学部本科生能够在国际一流水平会议上发表文章,是电信学部近年来坚持一流人才培养与学科发展建设相结合的成果体现,是专业教师悉心指导和学生刻苦努力的结晶,体现了学部高水平的研究平台与队伍。
研究成果“Double Nuclear Norm based Low Rank Representation on Grassmann Manifolds for Clustering”利用Grassmann流形理论和双低秩表示模型,有效提高了视频和图像序列等高维数据的无监督聚类精度,在海量无序视频图像数据标注等实际问题上有广泛的应用前景。在该文章中,视频和图像序列首先被表示为Grassmann流形上的一个样本点,随后利用流形非线性度量和双低秩表示模型获取样本自表示系数,最终得到数据的无监督聚类结果。
与学生张肇轩等共同完成的研究成果Deep Reinforcement Learning of Volume-guided Progressive View Inpainting for 3D Point Scene Completion from a Single Depth Image”讨论了基于单张深度图像重建三维点云室内场景的问题,重建好的场景模型可以用于室内机器人自动导航或场景交互、虚拟或增强现实等领域。该文提出了一种新颖的端到端的基于深度学习和强化学习的方法,为输出为点云表达的场景重建问题提供了新的解决思路。
上述研究工作得到国家自然科学基金重点项目“基于视觉和语义的室内场景理解与实时建模”、国家自然科学基金人工智能应急重点项目“基于DNA计算的人工智能新方法”、国家自然科学基金委重大项目“基于大数据的智慧交通基础理论与关键技术”、国家自然科学基金重大研究计划培育项目“面向动态非结构环境的共融机器人自然交互方法研究”、NSFC-辽宁省联合基金重点支持项目“仿人灵巧手的操作规划方法研究”项目、大连市基金双重项目“基于知识图谱的跨媒体大数据搜索与挖掘”的支持。
计算机辅助设计国家地方联合工程实验室,是国家发改委于2015 年批复的国家级实验室。面向新一代人工智能,围绕智能计算、智能感知与理解等人工智能核心问题,深入开展相关基础理论与核心技术及工程应用研究。在生物计算理论、多媒体信息感知与理解、场景感知与建模及其应用等方面,取得了一批有国际影响力的研究成果。相关成果在工业产品设计、新闻播报、智能交通、无人系统、健康管理等领域得到实际应用,获得国家自然科学二等奖1项、国家科技进步二等奖2项、省部级科学技术一等奖13项、二等奖5项,获国际期刊、会议最佳论文奖10项。
大连理工大学人工智能研究中心成立于2017年,是学校唯一专门设立的面向人工智能相关领域的独立科研机构,整合了电信学部计算机、控制、信通、生物医学等相关学科,充分发挥交叉学科优势,针对人工智能的核心理论与方法,设立类脑智能、大数据智能、机器人智能三个研究方向,研究以大数据智能、跨媒体智能、自主智能、人机混合增强智能和群体智能等为代表的新一代人工智能技术。