近日,2019年国际人工智能联合会议(International Joint Conference on Artificial Intelligence,IJCAI 2019)发布了论文录用通知。IJCAI是国际人工智能领域的顶级学术会议,代表人工智能领域的最高水平和发展方向,被中国计算机学会(CCF)推荐国际学术会议列表认定为A类会议。
本届IJCAI大会收到4752篇论文投稿,录用850论文,录用率仅为17.89%。
信息检索研究室(DUTIR)林鸿飞教授团队的论文“ Refining Word Representations by Manifold Learning”被录用,第一作者为博士生楚永贺。
论文主要工作:分布式词表示因其能够有效表示单词的语义信息,在自然语言处理各种任务中得到了广泛的应用。然而现有的词表示方法没有考虑到单词之间的几何结构对词嵌入的影响,低估了在欧氏空间中距离近的词的相似性,高估了距离远的词的相似性,从而导致不能有效表示单词之间的相似性。针对这一问题,我们运用流形学习对预先训练好的词表示进行纠正,从而使得单词在欧氏度量空间中相似度更接近单词的语义信息。我们在词汇层面的任务上(语义关联性、语义相似性)进行了实验,实验结果表明,与几种常用的词表示方法相比,我们提出的模型取得了较好的效果。
此项工作有效地改善了语义计算的精度,基于流形学习改进了常用的词向量表示机制,对于自然语言处理的相关任务具有较好的提升效果。
论文研究工作得到国家自然科学基金重点项目“社交媒体中文本情感语义计算理论和方法(No.61632011)”、国家重点研发计划“跨时空多源异构数据的融合、开放共享技术与平台“之课题3“面向实体的多源信息感知融合与理解技术研究(No.2016YFB1001103)”和国家重点研发计划“智慧司法智能化认知技术研究“之课题1“涉案当事人画像自动构建技术研究及系统研发(No.2018YFC0832101)”的支持。