python爬虫实践以及理解
第一个问题Python爬虫是什么?有什么用?
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
这上面整的花里胡哨的,说白了就是获取数据,从web页面获取。
实现一个简单的爬虫
1 |
|
执行前先安装requests这个库教程
直接在安装的pyhon下的python.exe执行就ok。
执行结果就是百度的html。
这里提供一下requests的教程
总结:就现在学到毛皮而言,思路还是很清晰,慢慢来,慢慢拓展。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!