近日,实验室关于大规模图像检索的工作“Deep Supervised Hashing for Fast Image Retrieval”(作者: Haomiao Liu, Ruiping Wang, Shiguang Shan and Xilin Chen)被IJCV接收。IJCV的全称为International Journal of Computer Vision,是计算机视觉领域的国际顶级期刊之一,2018年SCI影响因子为11.541。
对于图像检索任务,存储和计算高效的特征表示是提升方法可扩展性的关键。作为一种典型的大规模图像检索方法,哈希算法通过哈希函数将图像变换为紧致的二值编码,从而实现精简的存储和高效的相似性计算。在当前主流的哈希学习算法中,尤其是基于卷积神经网络的算法,受限于二值编码的离散化表示特性,无法使用标准的基于梯度的方法进行哈希函数的学习。为了解决这个问题,现有的基于卷积神经网络的哈希学习算法通常对二值编码进行实数化松弛后,采用一些较弱的约束代替二值约束,但是也因此会导致学习到的实数表示与最终的二值表示之间存在一定的差异。为了更好地解决这个问题,我们提出了一种新的正则化约束,要求松弛后的实数表示尽可能接近哈希学习目标中的离散取值。我们设计的正则化约束与多种已有的判别性约束兼容,如对比损失、三元组排序损失等。因此,我们的方法可以通过降低量化损失的方式,使得模型学到的实数特征表示在量化之后仍然可以保持很好的判别能力,从而达到更好的检索性能。方法的总体框架图如下:
总体而言,该工作的主要贡献包括:1)设计了一种有效的适用于哈希学习算法的正则化约束,通过减小量化损失,保证量化后的图像特征表示可以保持量化前的强判别能力;2)基于提出的正则化约束,设计了一套适用范围广、通用性强的深度监督哈希算法(Deep Supervised Hashing, DSH);3)在多个标准的图像检索评测数据集上对所提出的方法进行了充分的分析和验证,并获得了state-of-the-art的检索精度。该项工作的前期会议版本发表于IEEE CVPR 2016。
论文信息:Haomiao Liu, Ruiping Wang, Shiguang Shan and Xilin Chen. “Deep Supervised Hashing for Fast Image Retrieval,” International Journal of Computer Vision (IJCV), 2019. (Accepted on Feb.18th, 2019).
附件: