通俗易懂,搞定Python中的深浅拷贝
Python中的深浅拷贝
在讲深浅拷贝之前,想先讲一下 is
和 ==
的区别。
在进行对象是否相等比较的时候我们可以用 is
和 ==
很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:961562169
- is: 比较两个对象的引用是否相同,即 它们的id 是否一样
- == : 比较两个对象的值是否相同。
id() ,是Python的一个内置函数,返回对象的唯一标识,用于获取对象的内存地址。
如下
a = 1 b = 1 print(id(a)) # 2057422768 print(id(b)) # 2057422768 print(a is b) # True
首先,会为整数1分配一个内存空间。 变量a 和 b 都指向了这个内存空间(内存地址相等),所以他们的id相等。
即 a is b
为 True
但是,真的所有整数数字都这样吗? 答案是:不是! 只有在 -25 ~ 256范围中的整数才不会重新分配内存空间。
如下所示:
因为257 超出了范围,所以id不相同,所以 a is b
返回的值为False。
>>> a = 257 >>> b = 257 >>> print(id(a)) 20004752 >>> print(id(b)) 20001312 >>> print(a is b) False >>> print(a == b) True
这样做是考虑到性能,Python对-5 到 256 的整数维护了一个数组,相当于一个缓存, 当数值在这个范围内,直接就从数组中返回相对应的引用地址了。如果不在这个范围内,会重新开辟一个新的内存空间。
is 和 == 哪个效率高?
相比之下, is
比较的效率更高,因为它只需要判断两个对象的id是否相同即可。
而 ==
则需要重载__eq__ 这个函数,遍历变量中的所有元素内容,逐次比较是否相同。因此效率较低
浅拷贝 深拷贝
简单的了解了 is
, ==
, 下面我们一起来看看Python中的深浅拷贝。
先说结论吧:
- 浅拷贝: 拷贝的是对象的引用,如果原对象改变,相应的拷贝对象也会发生改变
- 深拷贝: 拷贝对象中的每个元素,拷贝对象和原有对象不在有关系,两个是独立的对象
浅拷贝
a = [1, 2, 3] b = list(a) # 可以通过list 对列表进行浅拷贝 c = a.copy() # 也可以通过copy函数进行拷贝 # 浅拷贝后,a/b/c的id 各不相同,说明指向了不同的内存地址-- 即 生成了新的对象 print(id(a)) # 16301992 print(b, "id:", id(b)) # id:16562024 print(c, "id:", id(c)) # id:16561960 print(a == b) # True 值相同 返回True print(a is b) # False id不同所以 is比较返回False # 给列表a 添加元素4 a.append(4) print(a) # [1, 2, 3, 4] print(b, c) # [1, 2, 3] [1, 2, 3] b和c 不受影响
以上可以看出,浅拷贝会分配一个新的内存空间,创建一个新的对象。但是如果被拷贝对象中有可变对象会怎么样呢? 看下面的代码
a = [1, 2, [3, 4]] b = a.copy() print(id(a)) # 23967528 print(id(b)) # 21738984 # 改变a中的可变对象 a[-1].append(5) print(a) # 在给a新增元素6 a.append(6) # [1, 2, [3, 4, 5], 6] print(a) # [1, 2, [3, 4, 5]] print(b)
可以看出,在列表a中新增的元素6,并没有影响b。但是在a的嵌套列表中新增的元素5,却影响了元素b。
原因在于: 对于a和b都指向了同一个列表[3, 4]。 所以当a中在列表新增元素5的时候,改变了那个列表的值,b也指向了那个列表,所以也会发生改变。
再看看下面的代码
a = [1, 2, (3, 4)] b = a.copy() print(id(a)) # 59162536 print(id(b)) # 60143400 # 改变a中的可变对象 a[-1] += (5, ) # [1, 2, (3, 4, 5)] print(a) # [1, 2, (3, 4)] print(b)
对于元组(3, 4),因为元组不可变,所以在元组中新增了元素5,实际上是生成了新的元组对象。而b列表中的元组引用并没有发生改变。
通过上面的两个例子可以看出浅拷贝可能会带来的弊端,在使用中需要大家进行相应的判断。或者去完整的拷贝某个对象,即 深拷贝。
深拷贝
所谓深拷贝呢,就是重新分配一个内存空间(新对象),将原对象中的所有元素通过递归的方式进行拷贝到新对象中。
在Python中 通过 copy.deepcopy()
来实现深拷贝。
import copy a = [1, 2, (3, 4)] # 深拷贝 b = copy.deepcopy(a) # 因为生成了新的对象所以,返回False print(a is b) a[-1] += (5,) a.append(6) print(a) # [1, 2, (3, 4, 5), 6] print(b) # [1, 2, (3, 4)] 深拷贝后的对象,根本不受原对象的任何影响