您当前的位置:
科研动态

实验室关于延迟反馈等方面的论文被SIGIR 2026接收

发布时间: 2026-04-16

20264月,实验室两篇论文被SIGIR 2026接收。SIGIR会议的全称是The International ACM SIGIR Conference on Research and Development in Information Retrieval,是信息检索领域的CCF-A类国际会议,今年是该会议第49届。会议将于2026720日至24日在澳大利亚墨尔本召开。

两篇论文的信息概要如下:

  1. Follow the TRACE: Exploiting Post-Click Trajectories for Online Delayed Conversion Rate Prediction (Xinyue Zhang, Yuanhao Ding, Xiang Ao)

延迟反馈是在线广告CVR预估面临的一个核心挑战,它迫使模型在标签准确性与数据新鲜度之间进行权衡。现有方法主要通过延迟建模或样本重加权来应对这一问题,但忽视了点击后行为在观测期内的演化过程。为克服这一局限,我们将这一演化过程形式化为反馈轨迹,并提出 TRACE方法。我们的方法并未对未揭示样本强制赋予硬标签,而是评估其累计反馈状态与转化或未转化之间的匹配程度,从而在无需等待最终结果揭示的情况下动态修正后验概率。针对轨迹在早期阶段存在的稀疏性问题,我们进一步设计了一种由可靠性门控的回溯式补全器,利用全生命周期数据为未揭示样本提供自适应的后验指导。大量实验结果表明,TRACE 优于现有最先进基线方法,并证实了该回溯补全模块可作为现有系统的一种模型无关的增强器。

  1. Deja Vu in Plots: Leveraging Cross-Session Evidence with Retrieval-Augmented LLMs for Live Streaming Risk Assessment (Yiran Qiao, Xiang Ao, Jing Chen, Yang Liu, Qiwei Zhong, Qing He)

直播的兴起改变了在线交互方式,使海量实时互动成为可能,但也使平台暴露于诈骗和协同恶意行为等复杂风险之中。有害行为往往是逐步累积形成的,并会在看似无关的不同直播场次中反复出现,因此检测这些风险具有挑战性。为了解决这一问题,我们提出 CS-VARCross-Session Evidence-Aware Retrieval-Augmented Detector,跨场次证据感知的检索增强检测器),用于直播风险评估。在 CS-VAR 中,一个轻量级、领域专用的小模型执行快速的场次级风险推断;在训练阶段,它受到大语言模型(LLM)的指导。该 LLM 会对跨场次行为证据进行推理,并将其从局部到整体的洞见迁移给小模型。这样的设计使小模型能够识别跨直播间反复出现的模式,执行结构化风险评估,并保持适合实时部署的高效率。在大规模工业数据集上的离线实验表明,CS-VAR 达到了当前最优性能。此外,CS-VAR 已部署在抖音直播平台上,提供可扩展的内容治理能力以及可操作的局部化风险信号。

【论文链接】https://arxiv.org/abs/2601.16027


附件: