MLDM课题组关于时空活动建模的论文被IEEE TKDE接收

近日,实验室MLDM课题组关于时空活动建模的论文被IEEE TKDE接收。IEEE TKDE的全称是IEEE Transactions on Knowledge and Data Engineering,是CCF推荐的数据库、数据挖掘、信息检索领域A类期刊,近两年影响因子3.857。论文信息如下:

Spatiotemporal Activity Modeling via Hierarchical Cross-Modal Embedding (Yang Liu, Xiang Ao*, Linfeng Dong, Chao Zhang, Jin Wang, Qing He)

时空活动建模,旨在基于移动端数据(如带有地理位置信息的社交媒体记录),捕捉人们在不同时间、不同地点的活动规律,是城市计算的重要组成部分。由于社交媒体数据往往包含多个模态(时间,地点,文本等),现有最先进的方法通过跨模态嵌入将来自不同模态的单元嵌入至同一隐空间,从而度量不同模态单元之间的相似性,来建模人类的活动规律。虽然这种跨模态嵌入的方法是有效的,但是仅仅建模了不同模态单元之间的共现关系,没有考虑到高阶相似关系。

在这项工作中,作者提出了层次化的跨模态建模方法ACTOR,可以很好地建模人类活动中的高阶相似关系。从原始的社交媒体数据中,可以建立活动图和用户互动图(如左图所示),这里的高阶相似关系是指在构建出的互动图和活动图组成的大图中两个单元之间超过两级连边的相关关系。本文提出了6种高阶元图(Meta-Graph, M1~M6如右图所示)建模可能存在的高阶相似关系,并基于元图设计了层次化的嵌入方法,实现了对活动图中的高阶相似关系的建模。

在三个真实的公开社交媒体数据集上的实验表明,相较于最先进的时空活动建模方法,ACTOR在MRR(Mean Reciprocal Rank)指标上可以提升3%~5%。下图展示了检索一个港口地址后ACTOR方法与对比方法CrossMap返回的文本与时间信息。可以看出,ACTOR返回的结果更加符合港口场景,而CrossMap返回的结果多是更加宽泛的词汇,未明显体现出港口的特征。

2020/04/07