用python进行网络爬虫和信息提取,这个我觉得还是挺有用的一门课程,我自己通过这个视频的学习,初步知道了如何进行网络爬虫来获取自己需要的资料。视频资源我放在百度网盘,感兴趣的朋友下载学习吧。
授课老师也是非常有名的嵩天老师,北京理工大学的教授。
这门课程的总体目录如下:
【第〇周】网络爬虫之前奏
课时
“网络爬虫”课程内容导学
Python语言开发工具选择
【第一周】网络爬虫之规则
课时
本周课程导学
单元1:Requests库入门
单元2:网络爬虫的“盗亦有道”
单元3:Requests库网络爬虫实战(5个实例)
【第二周】网络爬虫之提取
课时
本周课程导学
单元4:Beautiful Soup库入门
单元5:信息组织与提取方法
单元6:实例1:中国大学排名爬虫
【第三周】网络爬虫之实战
课时
本周课程导学
单元7:Re(正则表达式)库入门
单元8:实例2:淘宝商品比价定向爬虫
单元9:实例3:股票数据定向爬虫
【第四周】网络爬虫之框架
课时
本周课程导学
单元10:Scrapy爬虫框架
单元11:Scrapy爬虫基本使用
单元12:实例4:股票数据Scrapy爬虫
不知道为啥,百度分享不成功了。谁知道怎么改。
自己把敏感词去去掉分享了还是不行,咋搞哦?我太难了
这就是大数据时代么。前两天百度云刚下载了爬虫的几个文档