当前位置：自学咖网 > 技术教程 > Pyhton常见问题 > Python爬虫反爬手段讲解

hmoban Pyhton常见问题 2023-10-09

Python爬虫反爬手段讲解

反爬方式的种类

1、判断请求头来进行反爬

这是很早期的网站进行的反爬方式

User-Agent 用户代理
referer 请求来自哪里
cookie 也可以用来做访问凭证

解决办法：请求头里面添加对应的参数（复制浏览器里面的数据）

2、根据用户行为来进行反爬

请求频率过高，服务器设置规定时间之内的请求阈值
解决办法：降低请求频率或者使用代理（IP代理）
网页中设置一些陷阱（正常用户访问不到但是爬虫可以访问到）
解决办法：分析网页，避开这些特殊陷阱
请求间隔太短，返回相同的数据
解决办法：增加请求间隔

3、js加密

反爬方式中较为难处理的一类。
js加密的原理：服务器响应给浏览器的js文件，可以动态的生成一些加密参数，浏览器会根据js的计算得到这些参数，在请求中带入进来，如果请求中没有这些参数，那么服务器就任务请求无效。

hmoban主题是根据ripro二开的主题，极致后台体验，无插件，集成会员系统
自学咖网 » Python爬虫反爬手段讲解

hmoban 普通

分享到：

相关推荐

pycharm提示不全如何设置

PyCharm是由JetBrains打造的一款Python IDE，VS2010的重构插件Resharper就是出自JetBrains之手。同时支持Google App Engine，PyCharm支持Iro...

Pyhton常见问题 2023-11-11
42

Django入门指南01-了解Django

前言今天我将开始一个关于 Django基础知识的全新系列教程。这是一个开始学习《Django 的完整入门指南》。教程材料一共会被分为七个部分。我们将从安装，开发环境的准备，模型，视图，模板，URL到更高级的主题（如迁...

Pyhton常见问题 2023-12-03
48

python3 之天天生鲜列表页排序order_by() 和分页器Paginator

url(r"^list/(?P<category_id>d*)/(?P<page_num>d*)$", views.ListGoods.as_view(), name="list"),

Pyhton常见问题 2023-10-09
53

01-为什么要学爬虫-python小白爬虫入门教程

学习目的以及需求需求来自于：抓取的某个网站或者某个应用的内容，提取有用的价值实现手段模拟用户在浏览器或者应用(app)上的操作，实现自动化的程序爬虫应用场景（利用爬虫能做什么？）大家最熟悉的应用场景抢票神器（...

Pyhton常见问题 2023-10-09
53

python进制转换（二进制、十进制和十六进制）及注意事项

使用内置函数实现进制转换实现比较简单，主要用到以下函数： bin()、oct()、int()、hex() 下面分别详解一下各个函数的使用（附实例）第一部分：其他进制转十进制 1.二进制转十进制使用函数：int() 实...

Pyhton常见问题 2023-11-29
49

怎么退出mysql

MySQL登录常用参数 -u 用户名 -p 密码 mysql -uro...

Pyhton常见问题 2023-11-17
45

自学咖网