-
Notifications
You must be signed in to change notification settings - Fork 2
【实战】利用爬虫实现知网高级检索后的文献预览和下载(逻辑分析) — Cyrus Ren #7
Comments
老铁,需要用户名登陆才能下载文件,这个咋搞啊? |
现在程序需要在你的网络有访问知网权限下才可运行(校内网),后期我会加上公网访问接口 |
我直接用用户登录后的cookie加到headers里,访问不到数据, |
老铁,知网爬虫有偿需求,联系QQ31558614,微信15739612006 |
老铁,公网接口还没搞出来了吗 |
爬取的下载连接没有问题,但是下载的CAJ文件内容是(访问连接超时,重新登陆) |
建议添加断点续传功能,人机互动会更友好! |
下载的数据量大了,时间长了就断了(放哪里下载,也就下载了400条),这个问题怎么解决啊? |
from UserInput import get_uesr_inpt |
请问main.py中的106行为什么会出现AttributeError: 'NoneType' object has no attribute 'group'这样的问题呢? |
我也遇到这种问题 ,请问解决了吗 |
请问为什么查询结果数量re.compile(r'.?找到 (.?) ') |
您好! 您的邮件我已收到,我会尽快与您回复! 武汉大学经济与管理学院 任天宇
|
获取文件详细信息的时候,page_detail.get_detail_page方法中self.session.get(page_url, headers=HEADER)返回结果为<response [200]>,想问下这是什么问题,另外现在貌似没有http://i.shufang.cnki.net/KRS/KRSWriteHandler.ashx这个注册了 |
您好! 您的邮件我已收到,我会尽快与您回复! 武汉大学经济与管理学院 任天宇
|
https://cyrusrenty.github.io//2018/12/19/cnkispider-1/#42-%E5%BE%97%E5%88%B0userkey
完整项目地址:https://github.com/CyrusRenty/CNKI-download
The text was updated successfully, but these errors were encountered: