615

分享到

Python中的那些“坑”

Python 2023-01-30 23:01:31 615人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

这里要看三组代码： # 第一组： >>>a=256 >>>b = 256 >>>a is b # 第二组： >>>a = 257 >>>b =

这里要看三组代码：

# 第一组：

>>>a=256

>>>b = 256

>>>a is b

# 第二组：

>>>a = 257

>>>b = 257

>>>a is b

# 第三组：

>>>a = 257; b = 257

>>>a is b

问题来了，这三组代码的运行结果分别是什么呢？答案是True、False和True。第一组和第三组结果是True好像没问题，那为什么第二组的结果是False呢？这里先用id()来查看一下a和b的地址是什么：

# 第一组：

>>>id(a)

>>>1426657040

>>>id(b)

>>>1426657040

# 第二组：

>>>id(a)

>>>363389616

>>>id(b)

>>>363392912

# 第三组：

>>>id(a)

>>>5722000

>>>id(b)

>>>5722000

可以看到第一组和第三组的a和b的id值是相同的，但是第二组是不同的。出现这种情况是因为python为了避免重复的创建和回收，就把那些常用的整数缓存起来，每次需要使用时直接从缓存中拿，而不是重新创建，这些整数的范围是[-5, 256]，不在这个范围之中的数字就要重新创建了。那为什么第三组的a和b是一样的呢？这是因为Python内部做了优化，对于在同一个代码块中的代码，如果出现两个值相同的整数，那么它们将被重用。这里可以用下面的代码进行测试：

a = 257
b = 257

def func():
    c = 257
    print(a is c)  # False

print(a is b)  # True
func()

这段代码中a和b的id值是一样的，和c的id值不同。这是因为a和b在同一个代码块，而c处在func函数里，属于局部变量，和a不在同一个代码块。所以在创建c的时候会重新创建，但是创建b的时候会重用a这个对象。
在Python的交互式命令行中，每单独一行都视为一个代码块，因此第三组中的a和b处在同一个代码块中，所以后者重用了前者，因此，两个变量的id是相同的。

都知道正则表达式中的re.sub()是用于字符串替换的，比如：

import re

def remove_tag(html):
　　text = re.sub('<.*?>', '', html, re.S)
　　return text

这段代码的功能就是将html中的标签都替换为空，没什么好说的，这里可以用一段html代码来测试一下：

html = """
<!DOCTYPE html><html lang="en">
<head><meta charset="UTF-8">
<title>Document</title>
</head><body></body></html>
"""
print(remove_tag(html))
# Document

运行结果和我们想象的一样，但是如果html代码再长一点呢？比如下面：

html = """
<!Dtp-equiv="X-UA-Compatible" content="ie=edge"><title>Document</title>
</head><bodOCTYPE html><html lang="en"><head><meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<meta hty><h1>h1标题</h1><h2>h2标题</h2><h3>h3标题</h3></body></html>
"""
print(remove_tag(html))

运行结果如下：

Document

h1标题h2标题h3标题</body></html>

为什么最后会多出来"</body></html>"呢？这两个标签不应该被替换掉吗？问题在于re.sub()的第四个参数，这里先看下sub()函数的原型：

re.sub(pattern, repl, string, count=0, flags=0)

那为什么我们把re.S放在count的位置也没有报错呢？难道说re.S是一个数字？打印出来看一下：

import re

print(re.S)
# 16

原来re.S还可以当数字用！这时候数一下上面那段html代码中的标签个数，发现"</body></html>"是第17和第18个，而因为re.S被当做16传给count参数了，就导致最后两个标签没有被替换掉。

相信很多人都用过lstrip()，在处理字符串的时候很有用，比如：

print("aabbcc".lstrip('aa'))
# bbcc

这很简单，也没什么问题，但是看下面这个例子：

print("ababacac".lstrip("ab"))
# cac

为什么结果不是acac呢？这是因为当lstrip()中传入一个字符串后，lstrip()会把这个字符串拆成一个个字符，然后才从左往右进行检查，如果匹配到就删除，直到出现第一个不同的字符，所以最后"ababa"被删掉了，结果也就是"cac"了。要避免这种情况的话，可以用replace()方法进行替换。

如果要你创建一个包含三个空列表的列表，你会怎么做呢？

# 选项1
li =[[] for i in range(3)]

# 选项2
li = [[]*3]

# 选项3
li = [[]]*3

如果你运行一下，就会知道选项1和选项3能够得到我们想要的结果。这时候再运行一下下面这段代码：

li = [[]]*3
li[0].append(1)
print(li)
# [[1], [1], [1]]

为什么我们明明只给第一个列表增加了一个1，但是其他两个列表也增加了一个1呢？这是因为[[]]*3并不是创建了三个不同的列表，而是创建了三个指向同一个列表的对象，所以，当我们操作第一个列表时，其他两个列表内容也会发生变化。

您可能感兴趣的文档:

--结束END--

本文标题: Python中的那些“坑”

本文链接: https://lsjlt.com/news/181377.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Python中的那些“坑”

Python中的那些“坑”

python3中import的那么些坑

oracle 12.1的那些坑

Python里那些深不见底的“坑”

Shell中关于exit0的那些坑

Oracle 中关于 group by 的那些坑

Shell中关于exit 0的那些坑

Python学习教程（Python学习路线）：那些年我们踩过的那些坑。。。

细数java for循环中的那些坑

解决spring data redis的那些坑

Android开发中那些需要注意的坑

报表选型中那些想不到的坑

那些年踩过的Dubbo坑有哪些

Java Bean转Map的那些踩坑实战

python中那些时间

详细总结Java for循环的那些坑

解决Golang 中使用WaitGroup的那点坑

编程生涯 21 载，那些我踩过的坑

Android WebView那些坑之上传文件示例

JavaScript RequireJS 的那些坑，踩过一次终身免疫！

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义