Python采集高分剧弹幕数据,且做词云图可视化分析【含视频教程】

环境介绍

  • python 3.8
  • pycharm
  • requests >>> pip install requests
  • pandas >>> pip install pandas
  • jieba
  • stylecloud

获取弹幕代码

请求数据

源码.资料.素材.工具(软件)安装教程👉【点击领取】

python学习交流Q群:770699889 ###
# 伪装
headers = {
    # 浏览器基本信息
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36'
}
url = f'平台版权问题'
response = requests.get(url, headers=headers)

获取数据

# .text: 字符串
# .json(): 字典, {"":"", "":""} 包裹起来的内容
json_data = response.json()
barrage_list = json_data['barrage_list']

解析数据

# 遍历 循环
for i in range(0, len(barrage_list)):
    content = json_data['barrage_list'][i]['content']
    nick = json_data['barrage_list'][i]['nick']
    id = json_data['barrage_list'][i]['id']
    print(id, nick, content)

保存弹幕

python学习交流Q群:770699889 ###
with open('弹幕.csv', mode='a', encoding='utf-8-sig', newline='') as f:
    csv_writer = csv.writer(f)
    csv_writer.writerow([id, nick, content])

请添加图片描述

运行代码,得到结果

请添加图片描述

在这里插入图片描述

制作词云图

源码.资料.素材.工具(软件)安装教程👉【点击领取】

import pandas as pd  # 第三方模块
import jieba
import stylecloud

# 两年权限以外
# 冻结学时
# 被动重修以外, 也可以自行选择重修
# 1. 导入数据
df = pd.read_csv('弹幕.csv')
def get_cut_words(content_):
    # 定义停用词的表
    stop_words = []
    with open('stop_words.txt', 'r', encoding='utf-8-sig') as f:
        lines = f.readlines()
        for line in lines:
            stop_words.append(line.strip())
    # 添加关键词
    my_words = ['666', 'guichui灯']
    for i in my_words:
        jieba.add_word(i)
    word_num = jieba.lcut(content_.str.cat(sep='。'), cut_all=False)
    word_num_selected = [i for i in word_num if i not in stop_words and len(i) >= 2]
    return word_num_selected
text = get_cut_words(df['content'])

stylecloud.gen_stylecloud(
    text=' '.join(text),
    collocations=False,
    font_path=r'C:\Windows\Fonts\msyh.ttc',
    icon_name='fab fa-youtube',
    size=768,
    output_name='video.png'
)

在这里插入图片描述
请添加图片描述

视频教程

【Python零基础教学】采集视频弹幕并且做词云图可视化分析

好啦,今天的分享到这里就结束了 ~
对文章有问题的,或者有其他关于python的问题,可以在评论区留言或者私信我哦
觉得我分享的文章不错的话,可以关注一下我,或者给文章点赞(/≧▽≦)/

请添加图片描述

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值