-
user_info.py是个人所有微博的抓取
-
huati.py为对微博关键字话题的抓取
-
weibo_clean.py 为对用户所发微博清空
-
雾霾.xls是测试采集的数据
python
: 3.6.4
变量名 | 作用 |
---|---|
weibo_id | 微博文章id |
user_id | 用户id |
contents | 用户发布内容 |
times | 发送日期 |
praise_num | 点赞数 |
transmit_num | 转发数 |
comment_num | 评论数 |
create_time | 微博发布时间 |
- 新增settings配置文件
- 新增log日志 文件
-
settings.py
- 在settings文件中对驱动路径,数据库参数,微博账户设置即可
-
huati.py
-
可选择insert_one函数单条插入
-
可选择insert_many函数批量插入
-
默认使用Chrome, 也可自行更改为其它浏览器驱动
-
-
测试 (鸿茅药酒相关话题)
-
weibo_clean.py
-
在settings.py中配置好 USERNAME 与 PASSWORD, LOGIN_URL_COM
-
默认使用 WeiBoCleanCom类完成删除功能
-
WeiBoCleanCom 共享 WeiBoCleanCn获取的cookie完成登录,再获取 .com域名下的cookie
-
.cn域名下做删除暂时有点问题, 默认在WeiBoCleanCom中处理
-
# 使用
from weibo_clean import delete
delete.del_weibo()