好文档 - 专业文书写作范文服务资料分享网站

社交网络中基于图排序的好友推荐机制研究与实现(郑佳佳)

天下 分享 时间: 加入收藏 我要投稿 点赞

浙江大学硕士学位论文 第1章 绪论

也对中国互联网的发展和普及起到了积极的推动作用,随着各类社交网站在竞争中快速发展,用户规模迅速增长,根据CNNIC测算,截止到2009年底,中国使用交友和社交网站的网民数将达到1.24亿。

图1-1

社交网站用户年龄构成

社交网站用户年龄的年轻化特征非常突出,用户群以20-29岁的青年为主,达到52.6%,在这一年龄段高出全国网民平均水平22.8个百分点,而在其他年龄分段上,均低于全国网民的平均水平。社交网络中用户年龄构成如图1-1所示。

经过三、四年的发展,中国社交网络业务市场雏形已基本形成。2008年三大类SNS网站发展非常迅速。一是以娱乐为主的SNS网站,例如开心网、51.Com,这类网站在2008年发展非常迅速,并且在服务模式和盈利模式方面有所突破;二是以服务校园学生为主的校园SNS网站,例如校内网、QQ校友等,这类网站起步最早,并以占据最具活力的大学生群体作为核心竞争优势;三是以商务沟通和交友为主的SNS网站,例如联络家、XING网等,这类网站进入中国较晚,发展较为稳定。

在论坛中,用户的概念仅仅限于一个用户名;在博客中,用户可以发表文章,发表图片等,但是博客与博客之间的联系不够紧密;在社交型网络中,如人人网

4

浙江大学硕士学位论文 第1章 绪论

中,用户具有一个独立的空间,可以在里面更新状态,发表文章,上传照片等等功能。用户与用户之间可以添加彼此为好友,可以评论别人创建的文章、图片等资源。从论坛到博客在到社交网站,用户的概念越来越强,在网络中可以利用来进行个性化分析的资源越来越多。用户概念增强图如图1-2所示。

图 1-2 网络中用户概念增强图

1.3 本文工作

本文分析了社交网络的发展及社交网络中好友推荐问题。在社交网站上,用户可以添加其他用户为好友。对于一个用户,特别是新加入的用户,添加哪些用户为自己的好友成了一个困难的问题。本文针对这一问题提出了热点好友推荐及个性化好友推荐。

本文的主要工作如下:

1.提出了社交网络中好友推荐问题,皆在帮助用户更好的选择添加好友; 2.提出了社交网络中用于衡量信息传播的指标,利用该指标来做热点好友推荐; 3.提出社交网络中个性化好友推荐问题; 4.比较分析了三种个性化好友推荐算法的优劣。

4

浙江大学硕士学位论文 第1章 绪论

1.4 本文组织

本文后续内容的组织形式如下:

第2章是关键技术综述,将介绍好友推荐相关的研究工作,同时也将介绍分用于好友推荐的算法及链接分析技术。

第3章介绍信息传播贡献值,首先分析了社交网络上的用户行为,然后提出了社交网络中网页访问模型,最后提出了信息传播贡献值。利用信息传播贡献值来做热点好友推荐。

第4章提出了个性化好友推荐问题,设计了个性化好友推荐算法。 第5章介绍社交网络中好友推荐系统的设计与实现。首先将给出整个系统的流程图,然后介绍数据获取方法,接着介绍数据统计特性,随后展示推荐系统的界面,最后将实验结果给出分析。

第6章针对本文工作做总结,并对下一步工作作出展望。

1.5 本章小结

本章介绍了社交网络的发展现状,阐述了社交网络中好友推荐问题的研究背景,说明了用户推荐的必要性,最后对本文的主要研究工作和内容做了概述。

4

浙江大学硕士学位论文 第1章 绪论

第2章 好友推荐关键技术综述

社交网络中的好友推荐问题分为两类,一类是全局意义的受欢迎的用户,我们称它为热点好友;另一类是针对某一个用户来说的好友,我们称它为个性化好友。社交网络中好友推荐问题和一般的推荐问题有其相似的地方,但又有区别。

2.1 问题描述

对推荐系统的研究文献很多。很多方法用到协同过滤技术,它利用用户爱好之间的相似性来推荐物品,例如电影。这些方法不依赖于物品的实际内容,而是需要用户对物品的偏好信息,通常通过评价打分的形式。

另一些研究利用物品的内容来推荐。Pazaani et al[2]利用网页包含的单词对网页进行描述,并利用用户的热点网页来建立用户的档案。他们根据档案利用朴素贝叶斯分类器来推荐有趣的网页。Mooney et al.[8]用一个相似的基于内容的方式来推荐书籍。

有些研究利用社交网站的结构来推荐。例如Spertus et al[3]根据现在社区的用户来推荐在线社区给用户,并在一个针对社交网络Orkut的大型研究中比较了几种不同的相似性度量。Geyer et al[4]利用社交网站的信息建立了一个系统来推荐自我描述的主题,指出基于社交网络的推荐优于简单的内容匹配推荐。

上述提到的技术都可以用于社交网络中的好友推荐。例如基于内容相似性的方法可以直接从档案、图片、评论、用户等来计算相似性。基于社交网络结构的方法也可以容易的用来推荐好友。相反,经典的协调过滤方法不能直接用因为她用评分在一个用户和物品组成的非均匀的网络推荐物品。社交网络中的用户推荐机制是推荐好友给用户,没有内容和物品的概念。

利用社交网络的信息在寻找专家是非常相关的一类研究。Ehrlich et al[5]介绍了一个系统,它支持用电子邮件或者聊天信息来帮助用户在他们的社交网络中来寻找专家。 不管怎么样,相比之前的研究,我们集中点不在于用户去寻找专家,而在于为了建立链接和交流,给社交网站上的用户推荐好友,与Facebook上的应

42

浙江大学硕士学位论文 第1章 绪论

用“你可能认识的人”相似。

2.2 推荐算法综述

2.2.1 协同过滤推荐算法

几十年下来,协同过滤推荐算法已经从抓住用户偏好的算法研究演化到追求效率的的商业系统。在这一章中,我们将介绍被人们熟知的协同过滤推荐算法。Breese et al[6]把协同过滤算法分成两类:基于记忆的算法需要把所有的评分,物品,用户都装在内存中,基于模型的算法离线周期性的创建评分模式的摘要。纯基于记忆的算法在实际应用中的扩展性不好。因此几乎所有的实用算法都是利用预处理的方式来减少时间的复杂度。所以现在实用的算法要么是纯基于模型的算法要么是一些混合的算法。

最著名的协同推荐算法是最近邻算法。我们介绍两类不同的最近邻协同推荐算法:基于用户的最近邻算法和基于物品的最近邻算法。

基于用户的最近邻算法:早期算法基于相似用户的评分对用户进行预测。我们叫这些相似的用户为邻居。如果一个用户n和用户u相似,我们把n叫作u的邻居。基于用户的算法依据用户u的邻居对i的评分对物品i进行预测。我们可以用所有邻居评分的平均值来对i评分。如等式一所示, rni是邻居n对i的评分。

pred(u,i)??n?neighbors(u)nirnumberofneighbors 公式(2.1)

等式2.1没有考虑某些用户u的邻居比另一些与u更相似。我们能通过给用户加权重的方法给出更精确地预测。如果用Sim(u,n)衡量一个用户u和它的邻居n的相识性,等式2.2给出另一种预测。

pred(u,i)??n?neighbors(u)userSim(u,n).rni

公式(2.2)

因为用户的相似度相加不等于一,所以这个方法不正确。因此提出规范化后的等式2.3。

42

社交网络中基于图排序的好友推荐机制研究与实现(郑佳佳)

浙江大学硕士学位论文第1章绪论也对中国互联网的发展和普及起到了积极的推动作用,随着各类社交网站在竞争中快速发展,用户规模迅速增长,根据CNNIC测算,截止到2009年底,中国使用交友和社交网站的网民数将达到1.24亿。图1-1社交网站用户年龄构成社交网站用户年龄的年轻化特征非常突出,用户群以20-29岁的青
推荐度:
点击下载文档文档为doc格式
48r3i6x0z99bpag891bi6tck19hq4z003f7
领取福利

微信扫码领取福利

微信扫码分享