IJCAI 举办的“The 26th International Joint Conference on Artificial Intelligence”国际人工智能联合会议是本领域的年度顶级国际会议。来自世界各国人工智能领域的专家、教授和学生,以及世界上人工智能领域公司的精英代表出席了会议。本会议集合了人工智能领域最前沿的课题研究和工业应用,大会分为邀请报告、口头报告和壁报三种形式,其中所有被大会正会接收的论文都要求作者先做分组口头汇报,然后再做壁报展示并与其它参会者讨论。
在本次会议中,以蒋树强为第一作者的另一篇论文“Dual Track Multimodal Automatic Learning through Human-Robot Interaction”也被接收为正会论文。在该文中,我们提出了一种双轨多模态融合系统,实现了视觉感知与知识获取的融合。同时通过在线的视觉感知与知识获取,实现了视觉识别模型的增长性训练。进一步利用人机交互系统,可以实现人对智能视觉识别系统的指导性训练。
此次会议上,宋新航为一作的一篇论文“Combining Models from Multiple Sources for RGB-D Scene Recognition”被收录为正会论文。在该文中,针对RGB-D图像的场景识别,我们不仅关注于CNN底部层特征的学习,同时面向更全面的RGB及Depth模态融合,提出了一种多源多模态网络融合的CNN架构。其中多源是指用于CNN模型初始化的参数有不同的来源,包括在大规模彩色数据集Places上预训练得到的参数,及基于深度(depth)图像由弱监督训练得到模型参数。多模态有机融合是指不同于传统方法只在CNN模型中的高层实现连接融合,而且根据先验知识在任意CNN层实现网络连接融合。 本届会议中,分组报告的文章也需要通过墙报展示以达到更好的交流。在展示墙报过程中,我们的文章较受欢迎,吸引了不少中外学者的关注,并和学者们就对RGB-D图像在计算机视觉任务中的应用,和基于RGB-D图像的卷积神经网络训练及融合等进行了探讨。
与会期间,我们和来自国内外的专家学者围绕相关工作进行了热切的交流和讨论,包括与来自美国麻省理工学院的Rohan Paul教授交流关于多模态视觉感知与知识获取方向的技术发展与前景,与来自西班牙视觉中心的Arnau Ramisa教授及英国牛津大学的学生等交流关于RGB-D多模态融合的视觉识别任务等。通过参加本次会议,使我们能面对面的与国内外同行进行了深入探讨和交流,一方面使我们的工作能为更多的人所了解,提升了我们课题组在国际上的影响力,另一方面有助于同与国内外同行建立了更加广泛的学术联系。
附件: