4月14日,实验室关于互联网广告点击率预估的工作“Warm Up Cold-start Advertisements: Improving CTR Predictions via Learning to Learn ID Embeddings”(作者:Feiyang Pan, Shuokai Li, Xiang Ao, Pingzhong Tang, Qing He)被ACM SIGIR2019会议以长文并口头报告形式接收。SIGIR会议全称是International ACM SIGIR Conference on Research and Development in Information Retrieval,是CCF推荐的数据库、数据挖掘、内容检索方向A类会议。此次会议长文录用率为20%(84/426),将于2019年7月在法国巴黎召开,接收论文概要信息如下。
点击率(CTR)预估一直是最重要的计算广告中的问题。最近,许多生成广告ID低维表示的嵌入向量学习技术大幅提高了CTR预估的准确性。然而,这种技术对数据要求很高,并且在低曝光广告上效果不佳,被称为冷启动问题。在本工作中,我们的目标是同时在冷启动阶段和预热阶段提高CTR预估性能。
为此,我们提出了一种名为Meta-Embedding的基于元学习的方法,学习如何为新广告ID生成理想的初始嵌入向量。主要贡献包括: (1)提出Meta-Embedding方法来学习如何学习新广告ID的嵌入向量以解决冷启动问题,它以广告内容和属性作为输入,生成新广告ID的初始嵌入向量。(2)提出一种简单而高效的基于梯度的元学习算法来训练Meta-Embedding生成器,在反向传播时使用二阶导数。(3)所提出方法易于在线场景实现,训练好的嵌入生成器可以取代普通的随机初始化为新广告冷启动预热。(4)三个大规模真实世界数据集上的实验结果表明,六种现有的最先进的CTR预估模型在使用Meta-Embedding方法后,都大大改善了新广告冷启动阶段和小广告热身阶段的预估效果。
图 Meta-Embedding Generator参数更新示意图
论文信息:Feiyang Pan, Shuokai Li, Xiang Ao, Pingzhong Tang, Qing He, Warm Up Cold-start Advertisements: Improving CTR Predictions via Learning to Learn ID Embeddings, to appear in SIGIR2019.
附件: