中国科学院智能信息处理重点实验室依托于中国科学院计算技术研究所,成立于1987年。在实验室学术委员会的学术指导和计算技术研究所的大力支持下,实验室逐渐发展成为我国智能信息处理领域的重要基础研究基地。
  实验室的研究工作围绕国家需求和国际科技发展前沿,同时考虑服务于国民经济建设的需要。实验室的定位是探索机器感知与认知的机理、理论、方法、技术,开展基础性研究以及相关的应用基础性研究,提出新的概念与模型,解决核心技术问题,并构建相应的系统。实验室的目标是在智能信息处理基础理论研究领域达到世界一流水平,培育前瞻思想,产出一流成果,培养基础人才,从而为智能技术形成智能产业提供基础原理、核心技术以及关键应用原型,为“人工智能”走向“人工智能+”提供技术支撑,为国家信息技术的长期发展储备知识、创新技术和人才。
  智能信息处理重点实验室以信息的智能处理为主线,依托计算技术研究所在系统、网络等方面的优势,从信息的获取、表示、理解与转换等几个方面进行布局,构成了一个互为依托的有机整体。实验室的主要研究方向,包括计算机视觉、模式识别、机器学习与数据挖掘、自然语言处理与理解、多媒体技术、医疗影像分析、生物信息学、大规模知识处理和智能人机接口等。
        过去十年来,实验室在中国计算机学会认定的A类国际刊物(如IEEE T PAMI, IEEE T IP, IJCV,AI等)以及领域A类国际会议(如CVPR,ICCV,ACL,AAAI, IJCAI, ACM MM等)上发表论文200余篇,获得发明专利授权100余项,所发表的论文被国内外同行引用超过30,000次。在高维、非线性视觉模式方面的研究成果获2015年度国家自然科学二等奖,在神经机器翻译方面的工作获得ACL大会的Best Long Paper Award。
        在应用方面,所研发的人脸识别、机器翻译、知识处理、蛋白质序列鉴定技术被成功的产业化或被华为等合作伙伴规模化应用到其产品中,产生了良好的经济和社会效益。
实验室新闻
24 2021.11
热烈祝贺实验室山世光老师当选IEEE Fellow

  近日,电气和电子工程师协会(IEEE)宣布了 新当选的2022 年 IEEE Fellow 名单,实验室山世光老师因在“视觉信号处理与识别”领域做出的贡献而成功当选。
  IEEE,全称“电气和电子工程师协会”(Institute of Electrical and Electronics Engineers),是美国的电子技术与信息科学工程师的协会,也是世界上最大的非营利性专业技术学会,致力于电气、电子、计算机工程和与科学有关的领域的开发和研究,在航空航天、信息技术、电力及消费性电子产品等领域已制定了900多个行业标准,现已发展成为具有较大影响力的国际学术组织。IEEE Fellow为该协会最高等级会员,是IEEE授予成员的最高荣誉,每年由IEEE同行专家在拥有高级(senior)或终身(life)等级的会员中评选,当选人需要对工程科学技术的进步或应用作出重大贡献,为社会带来重大价值。当选人数不超过IEEE当年会员总人数的1‰。
  当选理由:对视觉信号处理与识别领域做出的贡献
  个人简介:山世光,中科院计算所研究员/博导。他的研究领域为计算机视觉、模式识别和机器学习。已发表论文300余篇,其中CCF A类论文110余篇,论文被谷歌学术引用25,800余次。研究成果获2005年度国家科技进步二等奖、2015年度国家自然科学二等奖,且成果规模化应用于公安部门、华为等。他是国家万人计划领军人才,基金委优青,国务院特殊津贴专家,北京市科技新星,人社部国家百千万人才工程有突出贡献中青年专家,CCF青年科学家奖获得者,中科院青促会优秀会员,腾讯科学探索奖获得者。他曾应邀担任过CVPR, ICCV, AAAI, IJCAI, ACCV, ICIP, FG等近20次领域主流国际会议的领域主席,现/曾任IEEE TIP, CVIU, PRL, Neurocomputing, FCS等国际学术刊物的编委(AE),担任《中国图象图形学报》领域主编,《电子学报》和《电信科学》编委。他是中国人工智能学会模式识别专委会副主任,中国人工智能学会情感智能专委会副主任,中国计算机学会计算机视觉专委会常务委员。他还是视觉与学习青年学者研讨会(VALSE)的共同发起人和核心组织者之一。
科研动态

实验室4篇论文被SIGKDD2022会议接收


  2022年5月19日,实验室四篇论文被SIGKDD2022接收。SIGKDD会议的全称是“ACM SIGKDD Conference on Knowledge Discovery and Data Mining”,是数据挖掘领域的CCF-A类国际会议,今年是该会议第28届。四篇论文的信息概要如下:
  1. UD-GNN: Uncertainty-aware Debiased Training on Semi-Homophilous Graphs (Yang Liu, Xiang Ao, Fuli Feng, and Qing He) (Research Track)
  图的同质偏好假设指出,图神经网络(GNN)在同质偏好图(连边节点标签相同)上表现良好,但不能很好地推广到异质偏好图(连边节点标签不同)中。已有的同质偏好或异质偏好的概念是对整个图的全局度量,很难描述节点的局部性质。从节点级的角度来看,作者发现现实世界的图结构多表现为同质偏好和异质偏好的混合,即同质偏好节点和异质偏好节点同时存在。在这种混合下,作者发现GNN严重偏向于同质偏好节点,在异质偏好节点上的性能急剧下降。为了缓解上述偏差问题,作者提出了不确定性感知的去偏图神经网络(UD-GNN)框架,它保留了有偏模型在确定节点上的知识,并对具有高度不确定性的节点进行补偿。UD-GNN通过估计GNN输出的不确定性识别异质偏好节点,然后通过修剪带有特定节点的有偏参数和细化具有高不确定性节点上的自由权值来训练去偏GNN。在合成数据集和多个基准数据集上的实验表明,UD-GNN模型表现更好,有效地缩小了同质偏好节点和异质偏好节点之间的性能差距。
  2. Reliable Representations Make A Stronger Defender: Unsupervised Structure Refinement for Robust GNN (Kuan Li, Yang Liu, Xiang Ao, Jianfeng Chi, Jinghua Feng, Hao Yang, and Qing He) (Research Track)
  得益于消息传递机制,图神经网络在许多任务上取得了巨大成功,尤其是半监督的节点分类任务。但许多研究表明,图神经网络对结构扰动的反应极其明显,攻击者可以通过恶意篡改图结构大大降低分类性能。对于这种结构脆弱性,一种直接的思路就是优化被篡改的结构,以往的方法往往通过原始特征或者端到端学到的表征来进行结构学习,但二者都存在一定的问题。基于特征的方法忽略了图中的结构信息,从而导致信息维度缺失;而基于端到端特征学习的方法,由于分类器性能受损,特征学习的质量也随之降低,不能有效地优化结构。基于此,作者提出了STABLE,一套无监督图结构优化框架,通过面向鲁棒性的数据增强对比学习得到可靠无监督表征,再基于表征相似度进行结构优化得到用于下游任务的图结构。在下游分类器上,作者分析得出GCN的重归一化会加剧图神经网络的脆弱性。因此,作者提出了一个度敏感的传播机制,解决了原始GCN鲁棒性的问题。作者在四个公开数据集上进行了广泛的评估,验证了各种场景下STABLE都具有高鲁棒性。
  3. Numerical Tuple Extraction from Tables with Pre-training (Qingping Yang, Yixuan Cao, and Ping Luo) (Research Track)
  表格在网络和各种垂直领域中无处不在,也存储了大量有价值的数据。然而,表格布局的巨大灵活性阻碍了对这些宝贵数据的智能理解。为了从表中解锁和利用这些知识,将数据提取为数值元组是一个关键步骤。在表格中提取数值元组需要深入了解单元格之间错综复杂的关联关系。这些关联关系隐含在表格的文本和视觉特征中,大致可以分为层级关系和并列关系。尽管许多研究在从表格中提取数据方面取得了相当的进展,但大多数研究只考虑了层级关系而忽视了并列关系。同时,已有研究也只在相对较小的语料库上评估他们的方法。作者提出了一个新的框架以从表格中提取数值元组,并在一个大规模测试集上对其进行评估。具体来说,作者将这项任务转换成单元格之间的关系提取问题。为了建模表格中具有复杂关联性的单元格,作者提出了一个基于BERT的预训练语言模型TableLM,以编码具有不同布局的表格。为了评估该框架,作者在一个包含19264个表格和60万个元组的大型金融数据集上进行了广泛的实验。
  4. User Behavior Pre-training for Online Fraud Detection (Can Liu∗, Yuncong Gao∗, Li Sun, Jinghua Feng, Hao Yang, and Xiang Ao) (Applied Data Science Track)* indicates equal contribution.
  COVID-19的爆发使线上平台的新兴服务迅速增长,同时也助长了各种各样的线上欺诈活动。由于技术和商业模式的创新,新兴服务的数量飞速增长,而标注数据的不足使现有的有监督和半监督欺诈检测模型对这些新兴服务可能失效。但是,网络平台在各类服务中不断积累了大量的无标注用户行为数据,这些数据可能有助于提高对新服务欺诈检测的性能。为此,作者提出可以对大规模无标注的用户行为序列进行预训练以支撑线上欺诈检测,其中用户行为序列由有序排列的用户行为组成。最近的研究表明,在行为序列中提取用户意图(由连续的用户行为组成)可以提高线上欺诈检测的性能。因此,作者设计了一个名为UB-PTM的模型,该模型通过三个不同粒度(行为、意图和序列粒度)的代理任务从大规模无标注数据中学习有关欺诈行为的知识。作者在交易级别和用户级别的三个线上欺诈检测下游任务上进行了广泛实验,结果表明UB-PTM更好地帮助了下游任务的性能提升。
  
学术活动

【会议出访】多媒体计算与多模态智能组蒋树强老师、王树徽老师参加ICME2017


  IEEE 举办的“International Conference on Multimedia & Expo”是多媒体技术研究领域的年度国际会议。自2000年在New York 举办第一届会议以来,至2017年已是18届。ICME 2017在时尚国际化大都市中国香港举办。此次ICME 2017共收到600多篇投稿,总共录用200篇左右,录取率约在30%,其中分组报告(oral)论文数量在80篇以内,录取率约为12%。可见该会的论文平均水平在不断提高。蒋树强和王树徽代表中科院计算所智能信息处理实验室参加了此次国际会议,全程参加了大会多个主题报告和tutorial报告,了解同行的研究进展,并与国内外研究学者开展了广泛深入的交流。
          
  在7月11日上午的poster session当中,蒋树强在此次会议上介绍了课题组在图像中关系检测方面的论文“Visual Relationship Detection with Object Spatial Distribution”。在报告过程中,与会者针对所提出方法的视觉关系类型、物体空间上下文建模等方面的技术思路和现有方法的比较方面进行了提问,在交流过程中作者也受到了较多的启发。在7月12日图像标题生成的oral session当中,蒋树强作为论文“Keyword-driven Image Captioning via Context-dependent Bilateral LSTM”的合作者,听取了论文第一作者张晓丹的讲解,并同与会者进行了会后的讨论和交流,对基于深度循环神经网络的图像摘要技术的未来发展趋势进行了展望。
          
  在7月12日上午的Oral Session中,王树徽代表吴益灵、张维刚和黄庆明对“ONLINE LOW-RANK SIMILARITY FUNCTION LEARNING WITH ADAPTIVE RELATIVE MARGIN FOR CROSS-MODAL RETRIEVAL”进行了介绍。在该研究中提出了一种在线低秩的跨模态关联学习的方法,并在两个公开数据库上对一些经典算法进行了深入评测,结果表明所提方法有效实现了在线跨模态相似度学习,应对了跨模态数据的特点。我们的工作获得了来自新加坡、中国香港、中华台北、美国和中国大陆的研究人员的广泛关注,并进行了热烈的交流和探讨。