Skip to content

将京东读书网页版的图书导出为单个HTML文件

Notifications You must be signed in to change notification settings

lovelyjuice/jdread-downloader

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

原理

通过控制浏览器翻页的方式获取书籍内容并保存到本地。

使用方法

  1. 安装jdk,jdk版本11以上,过程略。
  2. 下载ChromeDriver,和jdread-downloader.jar放在同一目录。ChromeDriver大版本要等于你安装的chrome版本,比如chrome 110就得用ChromeDriver 110版本。下载链接: https://chromedriver.storage.googleapis.com/index.html
  3. 在jar文件所在目录打开终端,运行jar包:java -jar jdread-downloader.jar
  4. 运行后会自动打开chrome,并跳转到登录页面,登录后打开书籍的第一页,向下滚动页面直至能看到“下一章”的按钮
  5. 回到命令行窗口输入任意字符按回车开始爬取,爬取完成后会生成HTML页面,如果想离线保存图片的话可以用浏览器打开然后右键另存为完整的HTML文件。
  6. 操作浏览器打开下一本书的封面,重复上一个步骤。

About

将京东读书网页版的图书导出为单个HTML文件

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages