基于方面类别的情感分析和推荐系统方法研究
随着电子商务的飞速发展,推荐系统在其中扮演着越来越重要的角色,人们对于推荐系统的要求也越来越高,不仅要求其能够进行精准的个性化推荐,还在推荐粒度以及可解释性等方面提出了更高的要求。而也得益于电商平台的飞速发展,其上丰富的评论信息为我们实现这些需求提供了可能,这也促进了融合评论信息的基于方面类别(aspect)情感分析的具有可解释性的推荐系统的发展。目前基于方面类别情感分析的推荐系统主要分为两个大的模块,第一模块是对于评论利用基于方面类别的情感分析(Aspect Based Sentiment Analysis,简称ABSA)技术抽取方面类别级别的信息特征,包含方面类别识别和基于方面类别的情感极性判别两个任务;第二个模块是将上一模块中抽取得到的特征或者表示与推荐系统进行融合。方面类别级别的特征会被分别加入到用户偏好和商品属性中丰富用户和商品的表示,从而进行更加准确,更加个性化的推荐。但是在主流的基于方面类别情感分析的推荐系统的各个模块和任务中仍存在一些问题,ABSA模块中,方面类别识别任务中过于关注模型集成和特征工程而缺乏对于问题和数据特点的分析,基于方面类别的情感极性判别任务中缺乏结构信息的指导,在推荐模块中方面类别级别的信息和推荐系统结合方式过于简单,并且推荐的可解释性仍然比较粗糙乃至缺失等等,针对这些问题,本文分别提出以下解决方法:1.对于方面类别识别任务中只关注于模型集成和特征工程的现状,针对于任务和数据重新进行了分析并观察到了两个现象,首先是评论文本简短,不同的部分表意明确且
独立;其次是某些单词对于方面类别的识别具有决定性作用,但是受限于数据规模、稀疏性等因素,无法发挥作用。根据这两个观察提出一种基于依存句法树的切分方法对于评论进行切分并分别进行方面类别识别,并将对齐特征加入模型提高识别准确率。2.对于基于方面类别的情感分析中缺乏结构信息的问题,引进一种基于强化学习的文本表示方法来学习评论文本的结构信息。加入策略网络,针对不同的方面类别决策是否进行删词操作,只保留下和当前方面类别相关的描述文本,从而得到不同方面类别视角下的表示,然后分别进行情感极性的判别,提高情感分类的准确率。3.针对于方面类别信息和推荐系统融合方式简单以及推荐的可解释性粗糙乃至缺失的问题,引入外部标准标注数据训练分类模型,并用其对于推荐评论进行标注得到方面类别和情感标签特征,然后利用卷积神经网络和注意力机制得到评论文本的抽象表示特征,并把方面类别识别作为辅助任务监督文本建模的过程。最后将这两类特征同时加入推荐系统丰富用户和商品的表示,同时可以根据用户和商品的方面类别和方面类别级别的情感标签的统计信息得到方面类别级别的推荐理由,满足更细粒度的可解释性的需求。本文提出了基于依存句法树切分的方面类别的识别模型、基于强化学习的方面类别情感分类模型和基于方面类别情感分析的推荐系统,并且在各自任务的标准数据集上分别进行了实验和针对性的比较,证明了这些改进的模型的有效性。