当前位置：自学咖网 > 技术教程 > Pyhton常见问题 > python3异步爬虫 ——aiohttp模板使用

hmoban Pyhton常见问题 2023-10-10

python3异步爬虫 ——aiohttp模板使用

一.简单使用和讲解

import aiohttp
import asyncio

async def fetch(client):
    async with client.get("http://httpbin.org/get") as resp:
        assert resp.status == 200
        return await resp.text()


async def main():
    async with aiohttp.ClientSession() as client:
        html = await fetch(client)
        print(html)

loop = asyncio.get_event_loop()     #返回一个事件循环对象，是asyncio.Baseeventloop的实例

for i in range(30):
    task = loop.create_task(main())     #添加任务

loop.run_until_complete(main())    #运行直至main()运行完

二.asyncio模块(事件相关)

Column	Column
Asyncio.get_event_loop()	返回一个事件循环对象，是asyncio.Baseeventloop的实例
Abstracteventloop.stop()	停止运行事件循环
Abstracteventloop.run_forever()	一直运行直到stop()
Abstracteventloop.run_until_complete(func())	运行直至func对象运行完
Abstracteventloop.close()	关闭事件循环
Abstracteventloop.is_running()	返回事件循环的是否运行
Abstracteventloop.create_task(func())	添加事件

三.asyncio模块回调(部分代码)

loop = asyncio.get_event_loop()     #返回一个事件循环对象，是asyncio.Baseeventloop的实例
task = loop.create_task(main())   
task.add_done_callback(callback)   #上面的mian方法的返回值为下面callback方法名所用方法的入参

四.aiohttp请求相关

1.发起请求

import aiohttp
import asyncio


async def request_get(url):
    async with aiohttp.ClientSession() as client:  # 创建
        async with client.get(url) as resp:
            assert resp.status == 200  # 如果状态码是200才往下走,不然抛异常
            print( await resp.text())


loop = asyncio.get_event_loop()
loop.run_until_complete(request_get("http://httpbin.org/get"))

2.添加请求头,params,cookies,代理

和reuqest模块类似直接加就可以了
#设置代理
 session.get("http://python.org",proxy="http://some.proxy.com")

3.自定义域名解析地址

#我们可以指定域名服务器的 IP 对我们提供的get或post的url进行解析
from aiohttp.resolver import AsyncResolver
 
resolver = AsyncResolver(nameservers=["8.8.8.8", "8.8.4.4"])
conn = aiohttp.TCPConnector(resolver=resolver)

4.控制同时连接的数量（连接池）

async def func1():
 cookies = {"my_cookie": "my_value"}
 conn = aiohttp.TCPConnector(limit=2)　　#默认100，0表示无限
 async with aiohttp.ClientSession(cookies=cookies,connector=conn) as session:
    pass

五.aiohttp响应相关

1.获取网站的响应状态码

resp.status

2.获取网站的请求头

resp.headers 来查看响应头，得到的值类型是一个dict
resp.raw_headers　　查看原生的响应头，字节类型
resp.history　     查看重定向的响应头

3.获取网站的响应内容

使用text()方法
使用json()方法  json格式
使用read()方法，不进行编码，为字节形式
r.content.read(10)  获取二进制流前10 
注意：text(),read()方法是把整个响应体读入内存，如果你是获取大量的数据，请考虑使用”字节流“（StreamResponse）

hmoban主题是根据ripro二开的主题，极致后台体验，无插件，集成会员系统
自学咖网 » python3异步爬虫 ——aiohttp模板使用

hmoban 普通

分享到：

相关推荐

python算法有用吗

有很多人说，学编程算法有用吗？学算法对于写程序来说非常重要。如果不打算进行算法相关的研究，你可以不学算法的证明等等，可必需得学会算法本身描述的操作、它的适用场景与局限、它解决的问题的抽象模型等。也就是说，你可以不知道...

Pyhton常见问题 2023-11-18
39

为什么Python必须在方法定义和调用中显式使用“self”？

为什么Python必须在方法定义和调用中显示使用“self”？这个想法借鉴了 Modula-3 语言。出于多种原因它被证明是非常有用的。首先，更明显的显示出，使用的是方法或实例属性而不是局部变量。阅读 s...

Pyhton常见问题 2023-10-11
41

django可以开发大型网站吗

Django是可以开发大型网站的，国内的豆瓣就是典型Python+Django开发的。 Django工作机制 1.用manage .py runserver 启动Django服务器时就载入了在同一目录下的settings...

Pyhton常见问题 2023-11-26
49

Python基础进阶之海量表情包多线程爬虫

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理

Pyhton常见问题 2023-10-09
56

将python打包在手机上可运行吗？

将python程序打包为apk即可在手机上运行。将Py文件打包成apk文件的方法： 1、通过Buildozer;(在linux环境下实现,集成式框架比较容易实现） 2、通过python for android,(这种可...

Pyhton常见问题 2023-11-03
49

python怎样嵌入java

一、JPype简述 1、JPype是什么？ JPype是一个能够让 python 代码方便地调用 Java 代码的工具，从而克服了 python 在某些领域（如服务器端编程）中的不足。 2、JPype与Jython(JP...

Pyhton常见问题 2023-11-21
38

自学咖网