当前位置：自学咖网 > 技术教程 > Pyhton常见问题 > python 爬虫

hmoban Pyhton常见问题 2023-10-09

python 爬虫

一、requests 模块爬虫基础写法

# 基础爬虫写法.py
import requests

def spider(url):
# 定义一个函数，爬取网页源码

	headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36"}
	# 定义个一个headers 里面放user-agnet，也可以放别的信息， 字典格式key-values
	# user-agent 会告诉网站服务器，访问者是通过什么工具来请求的。 类似伪造身份，让对端把自己当成浏览器

	ret = requests.get(url , headers=headers)
	# 请求一个地址，返回响应
	
	html = ret.content
	# 得到网页源码
	
	# html = ret.content.decode("utf-8")
	# 得到网页原码编码格式为utf-8
	
	return html
	# 返回网页源码



if __name__ == "__main__":

	url = "https://www.cnblogs.com/aaak/p/13968431.html"
	# url 地址

	html = spider(url).decode("utf-8")
	# 调用 函数，并指定编码格式

	print(html)

hmoban主题是根据ripro二开的主题，极致后台体验，无插件，集成会员系统
自学咖网 » python 爬虫

hmoban 普通

分享到：

相关推荐

自学Python-2 week！

一、copy用法 names2=names.copy()##浅copy假copy，无法改列表中带列表，因为存储模式关系，列表中带列表存储为单独的片段。浅copy的实现形式p1=copy.copy(names)p2=nam...

Pyhton常见问题 2023-10-09
123

Python爬虫：B站排行榜视频播放量，视频评论量等数据采集

前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。以下文章来源于CSND，作者嗨学编程

Pyhton常见问题 2023-10-09
121

20行Python代码撸一个命令行英语翻译工具

经常碰到不认识的英文单词就去有道字典网页去查查看，每次的过程都是“打开有道网页->输入单词->查看结果”，这个过程有点儿繁琐。可是一直不厌其烦的这样重复着，却不想解决一下。。。直到在微博上面看到有个人利用有道...

Pyhton常见问题 2023-11-05
89

django可以开发什么用

Django的用途用于web服务器的开发 Django的特点有完善的ORM关系映射有强大的路由映射功能有完善的视图模板的实现有健全的后台管理系统有强大的缓存支持 Django 是一个开放源代码的高级...

Pyhton常见问题 2023-11-27
117

python怎么做出一个软件

python做出一个软件的方法是：1、安装第三方库PyInstall；2、利用“pyinstall -F -w 文件名.py”即可将python文件做成一个小软件。我们首先还是使用pip进行安装： pip i...

Pyhton常见问题 2023-11-01
129

Python 四种数值类型(int,long,float,complex)区别及转换

Python支持四种不同的数值类型，包括int（整数）long（长整数）float（浮点实际值）complex （复数），数字数据类型存储数值。他们是不可改变的数据类型，这意味着改变数字数据类型的结果，在一个新分配的对...

Pyhton常见问题 2023-11-26
136

自学咖网