2026年5月16日,实验室有2篇论文被KDD 2026录用。KDD会议的全称是ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,是数据挖掘领域的CCF-A类会议。KDD 2026将于2026年8月9日至8月13日在韩国济州举办。
被录用论文简介如下:
1. Chat2Trade: Accelerating Bond RFQ Matching through LLM-based Parsing of Evolving Jargon (Yixuan Cao, Chunhao Yang, Yifan Wang, Jian Wang, Kun Wan, Gang Xiao, Ping Luo)
2024年中国债券二级市场的成交量达到2735.44万亿元人民币,其中绝大部分交易通过场外(OTC)市场完成。在该市场中,经纪人、买方与卖方通常通过群聊或私聊发送询报价(RFQ)消息,由此形成包含数以万计请求的RFQ池。经纪人需在该池中搜索并匹配合适的交易对手,以促成交易。匹配速度越快,能够获取的交易机会与收益就越多。然而,由于RFQ通常以非结构化文本形式出现,人工匹配过程耗时费力。为加速该流程,我们构建了一个自动化系统,其核心任务是将RFQ解析为结构化数据。该任务面临两大挑战:一是RFQ中存在大量高度领域化的行话术语;二是这些术语及其表达模式演化迅速。为应对这些问题,我们提出了一种基于大语言模型(LLMs)微调的RFQ解析方法。该方法包含三个顺序执行的组件:(1)消息切分(Message Chunking),将RFQ拆解为更短的消息单元;(2)小样本检索(Few-shot Retrieval),从历史RFQ中检索相似示例;(3)记录抽取(Record Extraction),利用检索到的示例生成结构化RFQ记录。与基线方法相比,该方法显著提升了解析性能,并在应对新的表达形式时表现出更强的适应性。基于上述方法,我们开发了 Chat2Trade —— 一个支持RFQ解析与快速筛选、查询的交易辅助系统。Chat2Trade 将经纪人的传统工作流程从主动检索相关RFQ转变为被动响应式的实时推送模式。该系统已在中国大型券商之一的中信建投证券部署近一年,使经纪人的平均成交量相较传统人工方式提升了3.67倍。
2. Outsmarting the Chameleon: Counterfactual Decoupling for Tactical OOD Shifts in Live Streaming Risk Assessment (Yiran Qiao, Jing Chen, Jiaqi Xu, Yang Liu, Qiwei Zhong, Xiang Ao)
直播已成为社交互动和数字商业的重要媒介,但同时也越来越受到复杂风险的困扰。该领域的一个根本挑战是战术性分布外偏移(tactical out-of-distribution, OOD shift):恶意行为者虽然保持稳定的底层目标,但会不断重新设计叙事包装以逃避检测。这类对抗性偏移暴露了现有 OOD 泛化范式的关键局限,因为在意图与战术高度耦合演化、且原始输入层面的反事实难以明确定义的情况下,这些范式所依赖的假设往往难以满足。
本文从潜在因果视角出发解决这一问题,并提出了 Latent-Predictive Counterfactual Decoupling(LPCD),一个用于鲁棒直播风险评估的即插即用框架。LPCD 通过在潜在空间中建模恶意意图与叙事变化,使模型能够在对抗性战术重包装下进行反事实推理,并通过施加潜在反事实一致性,将风险预测锚定在因果稳定的恶意意图上。在推理阶段,LPCD 进一步采用一种轻量、无参数的校准方法,以缓解由战术变化引发的分布偏移。我们在大规模工业数据集和线上生产流量上进行了广泛实验,结果表明 LPCD 持续优于现有最先进基线,验证了其在真实直播场景中应对不断演化的对抗性风险的有效性。

附件: