python爬虫实践以及理解

第一个问题Python爬虫是什么？有什么用？

网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

这上面整的花里胡哨的，说白了就是获取数据，从web页面获取。

import requests
res=requests.get("http://www.baidu.com")
res.encoding='utf-8'
print(res.text)

执行前先安装requests这个库教程

直接在安装的pyhon下的python.exe执行就ok。

执行结果就是百度的html。

这里提供一下requests的教程

总结：就现在学到毛皮而言，思路还是很清晰，慢慢来，慢慢拓展。

python

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！