Python网络编程 —— socket(套接字)及通信
1、socket概念
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。
其实可以认为,socket就是一个模块。我们通过调用该模块中已经实现的方法建立两个进程之间的连接和通信。
也可以将socket认为是ip+port,因为ip是用来标识互联网中的一台主机的位置,而port是用来标识这台机器上的一个应用程序。
所以我们只要确立了ip和port就能找到一个应用程序,并且使用socket模块来与之通信。
2、socket(套接字)的发展史及种类
套接字起源于 20 世纪 70 年代加利福尼亚大学伯克利分校版本的 Unix,即人们所说的 BSD Unix。 因此,有时人们也把套接字称为“伯克利套接字”或“BSD套接字”。一开始套接字被设计用在同 一台主机上多个应用程序之间的通讯。这也被称进程间通讯或 IPC。套接字有两种(或者称为有两个种族,分别是基于文件型的和基于网络型的。
基于文件类型的套接字家族
套接字家族的名字:AF_UNIX
unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成通信。
基于网络类型的套接字家族
套接字家族的名字:AF_INET
(还有AF_INET6被用于ipv6,还有一些其他的地址家族,不过,他们要么是只用于某个平台,要么就是已经被废弃,或者是很少被使用,或者是根本没有实现,所有地址家族中,AF_INET是使用最广泛的一个,python支持很多种地址家族,但对于网络编程而言,大部分时候只使用AF_INET)
3、TCP 协议和 UDP 协议
TCP(Transmission Control Protocol)可靠的、面向连接的协议、传输效率低全双工通信(发送缓存&接收缓存)、面向字节流。使用TCP的应用:Web浏览器;电子邮件、文件传输程序。
UDP(User Datagram Protocol)不可靠的、无连接的服务,传输效率高(发送前时延小),一对一、一对多、多对一、多对多、面向报文,尽最大努力服务,无拥塞控制。使用UDP的应用:域名系统 (DNS);视频流;IP语音(VoIP)。
4、socket(套接字)初使用
(1)、基于TCP协议的socket
<1>、 服务器端
import socket
sk = socket.socket() # 创建一个服务器的套接字
sk.bind(("127.0.0.1",9001)) # 绑定一个地址 IP +端口
sk.listen() # 开始监听客户端的请求
# 127.0.0.1 永远标识本机地址
# 不过交换机的 可以在编写代码的过程中排除一些网络问题
conn,addr = sk.accept() # 接收一个连接请求
conn.send(b"hello") # 向客户端发送信息
msg = conn.recv(1024).decode("utf-8") # 接收客户端信息,并限制了接收字节的个数
print(msg)
conn.close() # 结束与对方的信息传递
sk.close() # 关闭服务器套接字
<2>、 客户端
import socket
sk = socket.socket() # 创建客户套接字
sk.connect(("127.0.0.1",9001)) # 尝试连接服务器 IP +端口
msg = sk.recv(23) # 对话(发送/接收)
print(msg)
sk.send("你好".encode("utf-8"))
sk.close() # 关闭客户套接字
注意:
TCP是基于连接的,必须先启动服务器端,然后在再启动客户端去连接服务端。
UDP是无连接的,启动服务之后可以直接接受消息,不需要提前建立链接。
# 在重启服务端时有可能会遇到的报错
OSError: [Error 48] Address already in use
# 解决办法:加入一条socket配置,重用ip和端口
import socket
from socket import SOL_SOCKET,SO_REUSEADDR
sk = socket.socket()
sk.setsockopt(SOL_SOCKET,SO_REUSEADDR,1) # 加入这个
sk.bind(("127.0.0.1",8898)) #把地址绑定到套接字
···
(2)、基于UDP协议的socket
<1>、 服务器端
from socket import socket,SOCK_DGRAM
sk = socket(type=SOCK_DGRAM) # 创建一个服务器的套接字
sk.bind(("127.0.0.1",9001)) # 绑定服务器套接字
while True:
msg,cli_addr = sk.recvfrom(1024) # 对话(接收与发送)
print(msg.decode("utf-8"))
msg = input(">>>")
if msg.upper() == "Q":continue
sk.sendto(msg.encode("utf-8"),cli_addr)
<2>、 客户端
from socket import socket,SOCK_DGRAM
sk = socket(type=SOCK_DGRAM)
server_addr = ("127.0.0.1",9001)
while True:
msg = input(">>>")
if msg.upper() == "Q":
break
sk.sendto(msg.encode("utf-8"),server_addr)
msg = sk.recv(1024)
print(msg.decode("utf-8"))
5、socket 详解
socket.socket(family=AF_INET,type=SOCK_STREAM,proto=0,fileno=None)
<1>、 创建socket对象的参数说明:
family | 地址系列应为AF_INET(默认值),AF_INET6,AF_UNIX,AF_CAN或AF_RDS。 (AF_UNIX 域实际上是使用本地 socket 文件来通信) |
---|---|
type | 套接字类型应为SOCK_STREAM(默认值),SOCK_DGRAM,SOCK_RAW或其他SOCK_常量之一。 SOCK_STREAM 是基于TCP的,有保障的(即能保证数据正确传送到对方)面向连接的SOCKET,多用于资料传送。 SOCK_DGRAM 是基于UDP的,无保障的面向消息的socket,多用于在网络上发广播信息。 |
proto | 协议号通常为零,可以省略,或者在地址族为AF_CAN的情况下,协议应为CAN_RAW或CAN_BCM之一。 |
fileno | 如果指定了fileno,则其他参数将被忽略,导致带有指定文件描述符的套接字返回。 与socket.fromfd()不同,fileno将返回相同的套接字,而不是重复的。 这可能有助于使用socket.close()关闭一个独立的插座。 |
<2>、 socket的更多方法介绍
# 服务端套接字函数
s.bind() # 绑定(主机,端口号)到套接字
s.listen() # 开始TCP监听
s.accept() # 被动接受TCP客户的连接,(阻塞式)等待连接的到来
# 客户端套接字函数
s.connect() # 主动初始化TCP服务器连接
s.connect_ex() # connect()函数的扩展版本,出错时返回出错码,而不是抛出异常
# 公共用途的套接字函数
s.recv() # 接收TCP数据
s.send() # 发送TCP数据
s.sendall() # 发送TCP数据
s.recvfrom() # 接收UDP数据
s.sendto() # 发送UDP数据
s.getpeername() # 连接到当前套接字的远端的地址
s.getsockname() # 当前套接字的地址
s.getsockopt() # 返回指定套接字的参数
s.setsockopt() # 设置指定套接字的参数
s.close() # 关闭套接字
# 面向锁的套接字方法
s.setblocking() # 设置套接字的阻塞与非阻塞模式
s.settimeout() # 设置阻塞套接字操作的超时时间
s.gettimeout() # 得到阻塞套接字操作的超时时间
# 面向文件的套接字的函数
s.fileno() # 套接字的文件描述符
s.makefile() # 创建一个与该套接字相关的文件