Skip to content

kcn3388/pagecut

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 

Repository files navigation

安装依赖selenium
在服务器中安装chrome浏览器和chromedriver,需要相同版本
将14行的chromedriver改为你的chromedriver的路径
45行C:\nb2\mimibot\src\plugins\pcr-rank\img\imgs中的C:\nb2\mimibot\src\plugins\pcr-rank\img改为你RES_DIR的路径

新增获取网页源代码功能,以辅助其他爬虫插件爬取动态网站(如必须真实浏览器访问才能获得的js变量)

指令:[获取网页源代码 + 链接 + 类型]

  • 类型可选:
    • "src":爬取全站源代码
    • "jsvar":爬取特定js变量,使用此类型时还需要输入js变量名

爬取到信息以后会保存在目录下data.txt

效果如图
图片
已知问题:会阻塞其他事件,当访问的链接加载较慢,会影响其他事件的响应

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%