当前位置：自学咖网 > 技术教程 > 编程最新 > 高级爬虫面试题测试题 v1.3

wen 编程最新 2024-01-31

高级爬虫面试题测试题 v1.3

引导图
Python Web高级爬虫工程师测试题
(请本文件发送到: SpiderTestQuestion@163.com 并附带简历)

1、用yield写一个斐波那契数列的生成器函数。

2、放一段scrapy项目parse函数的代码(解析列表页，使用分组提取，解析字段)。

3、遇到过哪些反爬策略，如果突破？

4、 scrapy各个模块启动顺序(Spider, Middleware, Pipeline的加载、实例化、Open、Close的顺序)。

5、使用过哪些抓包工具，各有什么优点。

6、有没有自己博客，贴一下网址。

7、字体加密反爬机制及分类。

8、遇到过那些验证码，怎么突破的，不使用打码平台有办法吗？

9、简述了解的采集任务管理平台，有何不同，有修改过源码吗？

10、遇到过哪些难度大的网站，卡在哪了，认为反爬的天花板网站/软件有哪些。

11、 selenium/splash/puppeteer(谷歌)/playwright(微软)/web scraper(插件) 优劣势。

12、 js/小程序/apk的Hook 原理。

13、遇到过那些防御系统，极验验证码/易盾/观镜防御系统反爬策略优劣。

14、简述绕过小程序动态调试中用户验证的方式。

15、还有哪些问题是没问到的，又是自己的优势优点，可自行作答

附件：高级爬虫面试测试题 v1.3

hmoban主题是根据ripro二开的主题，极致后台体验，无插件，集成会员系统
自学咖网 » 高级爬虫面试题测试题 v1.3

wen 普通

分享到：

相关推荐

php 怎么转换int

php转换int的方法：1、创建一个PHP示例文件；2、确定要转换的值；3、用“(int)”或“(integer)”方法强制转换即可，语法如“var_dump((int) "221");echo &q...

编程最新 2024-01-31
28

Python怎么用NumPy读取和保存点云数据

本篇文章给大家带来了关于Python的相关知识，主要介绍了Python如何用NumPy读取和保存点云数据，文章围绕主题展开详细的内容介绍，具有一定的参考价值，需要的小伙伴可以参考一下。【相关推荐：Python3视频教程...

编程最新 2024-01-31
34

apache如何禁止执行php

apache禁止执行php的方法：首先新建一个“.htaccess”文件；然后复制代码内容“Order allow,deny”到“.htaccess”文件中；最后将该文件直接放到网站根目录里即可。 apache禁止执行p...

编程最新 2024-01-31
27

Spring Cloud Alibaba 整合 Nacos 实现服务配置中心

在之前的文章《Nacos 本地单机版部署步骤和使用》中，大家应该了解了 Nacos 是什么？其中 Nacos 提供了动态配置服务功能一、Nacos 动态配置服务是什么？官方是这么说的： Nacos 动态配置服务是...

编程最新 2024-01-31
23

JVM集合之开篇点题

大家在平时的开发过程中是否遇到过StackOverflowError、OutOfMemoryError等类似的内存溢出错误呢？大家又是怎么解决这个问题的？再来，大家在面试过程中有没有被面试官提问过jvm的内部构造及如何优...

编程最新 2024-01-31
24

C+、Java、Python选择哪个编程语言?

学习编程成为很多人的首选，但是编程语言众多，很多人不知道要选择哪门语言发展。目前比较常见的编程语言就是C+、Java、Python，那么选择哪个编程语言?为大家介绍一下。　　C++ 　　C++在C语言的基础上进一步扩充...

编程最新 2024-01-31
26

自学咖网