Skip to content

Latest commit

 

History

History

NewsSpider

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 

网络爬虫之最基本的爬虫:爬取网易新闻排行榜

一些说明:

  • 使用urllib2或requests包来爬取页面。

  • 使用正则表达式分析一级页面,使用Xpath来分析二级页面。

  • 将得到的标题和链接,保存为本地文件。