2023年4月5日,实验室两篇论文被SIGIR 2023接收。SIGIR会议的全称是The International ACM SIGIR Conference on Research and Development in Information Retrieval,是信息检索领域的CCF-A类国际会议,今年是该会议第46届。两篇论文的信息概要如下:
1. Online Conversion Rate Prediction via Neural Satellite Networks in Delayed Feedback Advertising (Qiming Liu, Haoming Li, Xiang Ao, Yuyao Guo, Zhihong Dong, Ruobing Zhang, Qiong Chen, Jianfeng Tong and Qing He) (Long Paper)
随着转化付费策略在广告交易系统的广泛部署,转化率(Conversion Rate,简称CVR)预测成为在线广告系统的核心问题之一。然而,由于延迟反馈问题的存在,实时观察到的数据包含大量暂时没有转化的虚假负样本。在这种有偏数据分布下的训练会严重影响模型的性能。现有方法往往额外等待一段时间以确定样本是否转化,保障数据新鲜度的解决方案在已有研究中尚未得到充分探索。在这项工作中,作者提出了在线转化率预测模型DFSN(缩写自Delayed Feedback Modeling via Neural Satellite Networks)以聚焦数据新鲜度问题。作者为主模型分配了一个长等待窗口,覆盖大部分样本转化并大量减少虚假负样本。同时,作者设计了两种类型的卫星模型,从最新数据中学习,并利用在线迁移学习技术将其知识共享给主模型。借助这些卫星的信息,主模型可以应对数据新鲜度的损失,实现更精准的转化率预测。最后,在两个真实世界的广告数据集的实验显示,DFSN模型显著领先于基线模型。
2. Matching Point of Interests and Travel Blog with Multi-view Information Fusion (Shuokai Li, Jingbo Zhou, Jizhou Huang, Hao Chen, Fuzhen Zhuang, Qing He, and Dejing Dou) (Short Paper)
越来越多的人在网上分享关于兴趣点(Point of Interests,简称POI)的游记文档。作为一种由用户生成的旅游文档,POI游记可以帮助人们更全面地了解该POI。然而,POI游记文档的整体质量难以保证,且游记文档排序通常需要专业的领域知识或实际的旅游经验,因此并非一项简单的任务。尽管如此,我们发现在线上地图服务app中,用户对于目标POI的搜索行为可以用来辅助验证游记文档中POIs的质量,进而帮助完成游记文档排序任务。因此在本文中,我们提出了一种端到端的游记文档排序模型MOTIF(缩写自 Matching POI and Travel Blogs with Multi-view Information)。具体地,我们首先构造两张POI共现图作为多视图信息:(1)搜索级别POI共现图,反映了用户在线上地图服务app的搜索共现行为;(2)文档级别POI共现图,体现了游记文档中的POI 共现关系。由于两张POI图来自不同的语义空间,我们采用互信息最大化来对齐用户行为空间和内容空间,建模两张图的内在联系,获得高质量POI表征。此外,我们利用百度地图app上的真实数据进行了实验,验证了我们的方法可以获得更好的文档排序结果,并服务于百度地图app上的POI问答模块。
附件: