昨天5.4青年节,朋友圈已经被《后浪》刷屏,相信大部分人都看过了小破站献给新一代的演讲(商业片)。
习惯性地打开了微博和知乎,想看一下别人的看法,想知道我是不是有些颓废而与这个社会格格不入?当我打开了微博和知乎,我才发现《后浪》翻车了,原来我们都一样,都很难再感受到《后浪》中的激情和理想。在这里看着大家的评论和回答,就好像在看着自己过得生活,评论和回答太多,所以就直接爬了下来,然后上班的时候慢慢地看。爬取的地址分别为: 知乎回答:如何评价 B 站 2024 年五四青年节宣传短片《后浪》? 人民日报微博“奔涌吧,后浪!这是#献给年轻一代的演讲#”下评论 bilibili献给新一代的演讲《后浪》弹幕
微博和b站的代码参见我之前的文章,知乎的话以后再详细讲解。作为一名数据分析师就习惯把手头的数据分析一下,所以也就拿这些数据简单的进行了一下分析。
评论情感倾向
先调用百度AI来分析微博和b站的评论情感倾向。知乎的回答字数过多,做情感分析肯定不准确,就没做分析。 from aip import AipNlp \你的 APPID AK SK \APP_ID = '你的APP_ID' API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY '
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
text = \\调用词法分析 \
response = client.sentimentClassify(text)
# \表示情感极性分类结果 0:负向,1:中性,2:正向 # \表示分类的置信度
# \表示属于积极类别的概率 # \表示属于消极类别的概率 for info in response['items']: if info ['sentiment'] == 2: print(\正向\
if info ['sentiment'] == 0: print(\负向\
if info['sentiment'] == 1: print(\中性\
print(\可信度:\
print(\属于积极类别的概率是:\ print(\属于消极类别的概率是:\
需要注意的是,在各个平台评论最多的“奔涌吧,后浪!”,在百度AI中是个消极句子,需
要
特
殊
处
理
。
结
果
如
下
:
非常明显,b站的弹幕正向居多,而微博的评论负向居多。 词云
通过上文的情感分析,各家平台的用户对于《后浪》的态度各异,他们又是如何评价的呢?统计评论和回答中的高频词,制作词云看一下吧。 from scipy.misc import imread
from wordcloud import WordCloud, ImageColorGenerator
isCN = 1 # 0:英文分词 1:中文分词
back_coloring_path = '浪花.jpg' # 设置背景图片路径
text_path = 'reviews.txt' # 设置要分析的文本路径 stopwords_path = 'stop_word.txt' # 停用词词表
imgname1 = '词云图.png' # 保存的图片名字1(只按照背景图片形状) back_coloring = imread(back_coloring_path) # 设置背景图片
wc = WordCloud(#font_path = font_path # 设置字体 font_path='C:\\Windows\\Fonts\\simfang.ttf', #font_path='hanyiqihei.ttf',
background_color = 'white', # 设置背景颜色 max_words = 3000, # 设置显示的最大词数 mask = back_coloring, # 设置背景图片 max_font_size = 200, # 设置字体最大值 min_font_size = 20, # 设置字体最小值 random_state = 42, # 随机有N种配色方案 width = 2000 , height = 1720 ,margin = 4 ) words = {}
for i in word_counts:
words['{}'.format(i[0])] = i[1]
wc.generate_from_frequencies(words)
# txt_freq例子为 { word1: fre1, word2: fre2, word3: fre3,......, wordn: fren }
plt.figure()
B站
知乎
微博知乎微博更多在围绕“现实”、“社会”、“房价”、“韭菜”之类的词汇,5.4青年节的这个时点,自然对于这类满满鸡汤的“励志视频”非常反感。相反,在b站的用户看来,这是小破站在跨年晚会之后,再一次出圈并受到了主流媒体的认可,自然非常开心。
在 B 站外,我用代码看到了另一批“后浪”! - 图文



