5月9日,实验室关于无监督用户评论方面抽取的工作“Unsupervised Neural Aspect Extraction with Sememes”(作者:Ling Luo, Xiang Ao, Yan Song, Jinyao Li, Xiaopeng Yang, Qing He and Dong Yu)被IJCAI 2019会议接收。IJCAI会议全称是International Joint Conference on Artificial Intelligence(国际人工智能联合大会),是CCF推荐的人工智能方向A类会议。此次会议长文投稿量为4752篇,录用850篇,录用率约为17.9%,会议将于2019年8月在中国澳门召开。接收论文概要信息如下 。
方面抽取是细粒度情感分析任务中重要的一项子任务。在用户评论数据中,因为词汇语义的多样性以及上下文信息的有限性,使得短文本方面抽取任务具有如下挑战:(1)不同上下文会使得同样的词具有不同含义,难以消歧;(2)评论所描述的方面可能以含蓄的形式表达,难以感知;(3)部分方面词汇出现频率不足,难以捕获。在这项工作中,作者提出了两种基于义素(sememe)的自编码器,进行无监督方面抽取,改善现有方法的不足。该模型首先通过基于义素的神经网络扩充词的语义表示、形成句子嵌入向量,再通过句子重构训练方面嵌入向量辅助方面词汇抽取。
图1 所提出方法的整体框架图
图2 义素示意图
在Citysearch corpus和BeerAdvocate两个真实数据集上的实验结果表明,所提出的方法能改善短文本上的方面抽取任务。同时,提出的基于义素的网络结构中,层次化义素注意力机制可以有效扩展词的语义,附加的循环神经网络结构因编码了上下文信息,联合义素层能改善一词多义对方面抽取任务的影响,并发现低频方面词汇。
图3 可视化词级别以及义素级别的注意力权重分布
论文信息:Ling Luo, Xiang Ao, Yan Song, Jinyao Li, Xiaopeng Yang, Qing He and Dong Yu. 2019. Unsupervised Neural Aspect Extraction with Sememes. In Proceedings of the 28th International Joint Conference on Artificial Intelligence.
附件: