您当前的位置:
科研动态

实验室关于鲁棒主观视觉属性预测的论文被IEEE TPAMI接收

发布时间: 2020-12-25

近日,实验室关于鲁棒主观视觉属性预测的论文被IEEE T-PAMI期刊接收。IEEE T-PAMI的全称是IEEE Transactions on Pattern Analysis and Machine Intelligence,是CCF推荐的人工智能领域A类期刊,近年影响因子为17.86。论文信息如下:

Qianqian Xu, Zhiyong Yang, Yangbangyan Jiang,Xiaochun Cao,Yuan Yao, Qingming Huang*. “Not All Samples are Trustworthy: Towards Deep Robust SVP Prediction”, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2020. (doi: 10.1109/TPAMI.2020.3047817)

本文聚焦于如何准确估计给定图像中蕴含的主观视觉属性(Subjective Visual Property, SVP)这一关键问题。一般而言,SVP数据通常通过众包平台汇集大量标注者的在线标注完成。由于标注过程中无法对全部标注者的标注质量进行有效管控,SVP数据集中往往存在大量标注噪声。面向SVP数据中的不可靠标注,本文提出一种稳健的SVP学习框架以期在滤除异常样本的同时完成SVP精准预测。具体而言,本文提出两种框架应对该问题。首先,提出一种深度概率稀疏模型框架建模样本中的稀疏异常噪声。该框架虽可准确识别异常样本,但由于稀疏约束需要考虑全局样本,无法直接进行端到端训练。鉴于此,本文提出了该稀疏建模框架的重构理论,证明所提出的稀疏建模框架等价于对损失函数进行压缩操作。具体而言,在损失较小区间采用原损失函数,在损失函数值较大区间采用线性压缩函数,且深度概率稀疏模型中的异常样本恰好对应压缩损失中所有落入压缩区间的样本。根据该理论,本文提出对应的压缩损失优化框架,通过优化压缩损失完成该任务。在压缩损失优化框架中,模型可同时进行端到端高效训练并定位异常样本。进一步理论分析证明,最小化压缩损失亦可提升模型的泛化性能,得到更小的泛化界。本文进一步给出了两种框架在交叉熵损失及平方损失条件下的实现,并证明算法所检出的异常样本恰可对应HodgeRank 理论中的成环不一致信息,可明确解释众包数据中的全局排序错误,再次为所提出的框架提供了有力支撑。最后,本文在Human Age、 LFW、Shoes 三个属性标注数据集上展开了系统的实验分析,其结果均表明所提出算法能在标注含噪声条件下获得更优的模型性能。


附件: