好文档 - 专业文书写作范文服务资料分享网站

基于农产品特征属性评论倾向的协同推荐方法及系统与相关技术

天下 分享 时间: 加入收藏 我要投稿 点赞

图片简介:

本技术设计了一种基于农产品特征属性评论倾向的协同推荐算法及系统,解决目前电商平台中农产品推荐不够精准的问题;本技术改进传统协同过滤推荐算法只考虑用户评分的单一性,提出将用户评分结合评论情感倾向程度加权,用户评论中对农产品特征属性倾向进行量化,作为计算用户相似度的重要参数的改进方法,结合用户评分构建出用户点评模型矩阵;在计算用户相似度时使用矩阵代替传统推荐算法中用户评分进行计算,综合考虑用户评分和评论信息进行邻居集查找,最终确定推荐农产品集;本方法与传统协同过滤推荐算法相比,除了考虑评分之外,将不同用户评论信息中的潜在联系作为参数进行邻居集查找,有效地提高了电商平台中农产品推荐的精准度。

技术要求

1.一种基于农产品特征属性评论倾向的协同推荐方法,其特征在于,所述方法具体包括有以下步骤:

步骤一:通过将用户点评数据集进行预处理,提取电商农产品特征属性词的同时发掘出评论集中与特征属性词同义的其他词向量,构建农产品特征属性词集;

步骤二:通过农产品特征属性词集筛选用户评论数据,结合加权后用户评分构建用户点评模型,量化成用户评分-商品特征属性偏好矩阵;

步骤三:使用用户评分-商品特征属性偏好矩阵代替用户评分,使用协同过滤矩阵对不同用户的用户评分-商品特征属性偏好矩阵进行计算,找到目标用户TOP-K邻居集,根据预测评分推荐TOP-N电商农产品。

2.根据权利要求1所述的基于农产品特征属性评论倾向的协同推荐方法,其特征在于,所述构建农产品特征属性词集的方法

具体有包括以下步骤:

步骤一:使用改进TF-IDF使用加权逆词频后的TF-IWF算法,公式如下:

TF-IWF=TF×IWF

表示在爬取的评论数据集N中某词i重要性,其中TF表示词频,IWF表示加权之后逆词频,频总和值,nti表示对应词ti在评论中的词频总量;

表示评论中所有词语的词

计算并提取电商农产品下用户评论文本中词频和加权逆词频较高的词集,从而筛选出符合农产品特征属性的3个属性词

a,b,c;

步骤二:将用户评论训练过word2vec模型计算评论集中各词向量相似度,在所有用户评论集中找到与农产品特征属性词同义的其他词向量,构建农产品特征属性词集A{a1,a2,a3…an},B{b1,b2,b3…bn},C{c1,c2,c3…cn}。

3.根据权利要求1所述的基于农产品特征属性评论倾向的协同推荐方法,其特征在于,所述构建用户评分-商品特征属性偏好

矩阵的方法具体有包括以下步骤:

步骤一:从用户在评论逐条以分词结果筛选A、B、C 3个农产品特征属性集中属性词,如评论中出现该属性词,对应的农产品特征属性An or Bn or Cn偏好值为1,否则置为0;

步骤二:用户user{user1,user2,user3……usern}对农产品U{u1,u2,u3…un}的评分集{S1,S2,S3…Sn},引入情感词典和程度副词词典,将用户评论中情感倾向程度结合用户评分进行加权计算,其权重计算公式如下:

其中λ表示权重系数,Sn表示对应用户评分,

表示用户评论中程度副词由程度副词词典累加的总体程度等级

值,

由用户评论中情感词通过情感累加词典得到的总体情感倾向值,将权重系数λ与用户评分相乘得到最终加

权后评分集{λS1,λS2,λS3…λSn};

步骤三:基于加权后用户评分和评论中农产品特征属性偏好构建用户点评模型[评分,特征属性偏好],量化成用户n的评分-商品特征属性矩阵usern-Un:[λSn,An,Bn,Cn]。

4.根据权利要求1所述的基于农产品特征属性评论倾向的协同推荐方法,其特征在于,所述预测评分推荐TOP-N电商农产品

的方法具体有包括以下步骤:

步骤一:通过评分-商品特征属性矩阵,将用户-商品类型矩阵以如下方式替换:

以用户评分-商品特征属性矩阵代替评分,计算出不同用户与目标用户间的相似度sim(i,j),公式如下:

其中ex、ey分别表示表示用户i和用户j的用户评论情感模型矩阵中对应的矩阵值,n表示在农产品列表中各农产品的个数;步骤二:所得的结果Sim(i,j)集合进行降序排列,取前K个用户作为用户i的邻居集;将目标用户i可能会感兴趣的邻居集中用户点评过的农产品进行评分预测,预测评分公式如下:

其中S(i,K)表示与目标用户i最为相似的K个用户的集合,N(u)所有对农产品u感兴趣的其他用户的集合,v表示与用户i有相同爱好和偏向商品的其他用户。公式中wiv表示目标用户i对用户v的相似度,rvu表示用户v对u的评分;步骤三:得到的评分P进行降序排列作为推荐集,将前N个(Top-N)农产品推荐给目标用户。

5.一种基于农产品特征属性评论倾向的协同推荐系统,其特征在于,所述系统包括有:

数据收集模块,获取用户在电商平台下不同农产品的评论、评分数据,进行结构化存储;

数据分析模块,对各农产品的用户评论使用权利要求2中提到的TF-IWF算法进行商品特征属性词的提取,同时使用利用评论数据集训练后的word2vec模型提取农产品特征属性同义词向量构建农产品特征属性词集;

构建用户点评模型模块,将所有用户的各条评论进行农产品特征属性词挖掘,构建用户点评模型,基于加权评分和评论信息将用户点评模型量化构建用户评分-商品特征属性矩阵;

相似用户计算模块,对不同用户的用户评分-商品特征属性矩阵使用权利要求4中提到的改进欧氏距离相似性算法进行相似度计算,基于计算得到的目标用户与其他用户的相似度结果,构建目标用户邻居集;

评分预测模块,对所有目标用户进行邻居集中可能感兴趣农产品进行评分预测,构建农产品推荐结果集;推荐模块,将推荐结果进行预测评分高至低排序,将前N款农产品对目标用户进行推荐,完成推荐。

技术说明书

一种基于农产品特征属性评论倾向的协同推荐方法及系统技术领域

本技术涉及计算机推荐算法的领域,尤其涉及到一种基于农产品特征属性评论倾向的协同推荐算法及系统。背景技术

目前在计算机推荐算法领域中基于用户的协同过滤推荐算法较为常用,可以在大量的用户基础上发掘与目标用户兴趣行为相似的其他用户,从而达到个性化推荐农产品的目的。协同过滤推荐算法的核心在于依赖不同用户对于同一农产品的兴趣,从而找到与目标用户兴趣行为相似的邻居集,最后将邻居集中目标用户没有进行过兴趣行为的农产品同时也是目标用户最有可能感兴趣的农产品进行推荐。

传统的基于用户的协同过滤算法通过用户评分的高低利用相似度算法找到用户与用户之间的相似度,组成用户的邻居集。但传统的基于用户的协同过滤算法在计算不同用户相似度的过程中存在只考虑到用户对于商品的评分的问题,没有充分利用到用户对与商品的评论中可能出现的偏好信息。

农产品在电商平台中属于用户日常消费的热门品类,庞大的数据量让农产品的个性化推荐效果并不是很好。但各类农产品的特征属性鲜明,因此可以从用户评论中发掘更多有价值信息。

为了改善传统的基于用户的协同过滤算法对于用户评论没有充分利用的问题,本方法在分析用户之间的相似度时引入用户对商品特征属性的偏好,发掘不同用户之间潜在的相似度,同时利用评论中体现的情感倾向信息计算权重因子,确定最终加权后用户评分。即使用户即使对同一个商品的情感倾向即评分相差较大,但评论对商品的某特征属性的偏好一致,二者的相似度可以进一步提高。因此推荐算法中引入用户评论信息可以提高算法推荐质量,使设计的农产品推荐系统推荐结果更为精确和合理。技术内容

本技术设计了一种农产品特征属性评论倾向的协同推荐的算法。

本技术的算法思路是,从获取到的用户评论数据集结合用户评分,从用户评论中使用改进后的TF-IWF算法提取用户最关心的农产品特征属性词作为指标,利用word2vec模型找到特征属性词的同义词向量构成特征属性词集,组合用户评分构建用户评分-偏好矩阵代替用户评分使用改进后的欧氏距离计算用户相似度,构成目标用户邻居集进行推荐。根据上述思路,本技术的技术方案如下:

S1.将用户点评数据集进行分词,将用户评论去除停用词、符号等无具体意义的分词,构成用户评分-评论分词数据集,同时

整理出用户和农产品列表;

基于农产品特征属性评论倾向的协同推荐方法及系统与相关技术

图片简介:本技术设计了一种基于农产品特征属性评论倾向的协同推荐算法及系统,解决目前电商平台中农产品推荐不够精准的问题;本技术改进传统协同过滤推荐算法只考虑用户评分的单一性,提出将用户评分结合评论情感倾向程度加权,用户评论中对农产品特征属性倾向进行量化,作为计算用户相似度的重要参数的改进方法,结合用户评分构建出用户点评模型矩阵;在计算用户相似度时使用矩阵代替传统推荐算法中用户评分
推荐度:
点击下载文档文档为doc格式
3j7pt5a51q4vbt01gdv99bpag891im00403
领取福利

微信扫码领取福利

微信扫码分享