当前位置：自学咖网 > 技术教程 > Pyhton常见问题 > python入门——爬取整个网页源码

hmoban Pyhton常见问题 2023-10-10

python入门——爬取整个网页源码

一、源码

使用request库爬取整个网页

 1 import requests
 2 # encoding:utf-8  #默认格式utf-8
 3 
 4 def get_html(url): #爬取源码函数
 5     headers = {
 6         "User-Agent": "Mozilla/5.0(Macintosh; Intel Mac OS X 10_11_4)
 7         AppleWebKit/537.36(KHTML, like Gecko) Chrome/52 .0.2743. 116 Safari/537.36"
 8 
 9     }  # 模拟浏览器访问
10     response = requests.get(url, headers=headers)  # 请求访问网站
11     response.encoding = response.apparent_encoding #设置字符编码格式
12     html = response.text  # 获取网页源码
13     return html  # 返回网页源码
14 
15 r = get_html("https://www.baidu.com/")
16 print(r) #打印网页源码

hmoban主题是根据ripro二开的主题，极致后台体验，无插件，集成会员系统
自学咖网 » python入门——爬取整个网页源码

hmoban 普通

分享到：

相关推荐

Django 用户认证系统使用总结

Django用户认证系统使用总结 by:授客 QQ：1033553122 测试环境 Win7 Django 1.11 使用Django认证系统本文按默认配置讲解Django认证系统的用法。如果默认的...

Pyhton常见问题 2023-10-09
46

mysql如何卸载

mysql卸载的方法：在“我的电脑>管理>服务和应用程序>服务”中关闭mysql服务，在控制面板中选择写在mysql软件，删除c盘下的mysql文件夹，删除mysql注册表，删除用户“Applicat...

Pyhton常见问题 2023-10-29
37

linux如何启动mongodb

创建数据目录： # mkdir /data/mongo 创建配置文件 # vi /data/mongo/mongodb.cnf dbpath=/data/mongo/ logpat...

Pyhton常见问题 2023-11-16
40

pychram找不到python解释器怎么办

pycharm配置python的运行环境，需要在设置里面找interpretor解释器，如果本地安装有就设置好，没有的话，可以就在编辑器里 install安装,还有就是虚拟环境了。或者是启动时默认启动安装的Python...

Pyhton常见问题 2023-11-18
47

python3里的中文编码是什么?

当大家想要去了解一个内容，都会怎么做呢？有没有像小编这样，知道要去查找的呢？对于大家提问的这个问题，小编因为不是经常使用，也都快遗忘要怎么处理这个内容了，所以大家看下，知识就是一个不断累积的内容啊，下面小编一级给大家整理...

Pyhton常见问题 2023-10-28
47

08 解析模块

解析模块为什么要配置解析模块 1）drf给我们提供了多种解析数据包方式的解析类 2）我们可以通过配置,来控制前台提交的哪些格式的数据后台在解析，哪些数据不解析 3）全局配置就是针对每一个视图类，局部配置就是针对指定的视...

Pyhton常见问题 2023-10-09
43

自学咖网