Python列表边遍历边删除,怎么用才不报越界错误呢?
背景
今天双十一,昨晚有好多电商行业的 IT 工程师们挑灯夜战,为这个全民狂欢的购物节护航。还记得三年前我们公司一个产品上线前一周时,办公室内拉起“跟 Bug 死扛到底”的横幅,Bug 可以说是程序员的死穴。我每次预感到代码有 Bug 时,神色立马紧张起来。
编程路上,Bug 载道;前车之鉴,后车之师。本文整理了一些我在问答技术网站上看到的、回答过的有价值的问题。权当是个人知识库了!
IDEA 编辑的功能
IDEA 强大的自动代码补全功能快捷键 Tab,代码标签输入完成后,按Tab,生成代码。
div.class.out + Tab
- 常用的有
fori/sout/psvm+Tab
即可生成循环 -
System.out、main
方法等 boilerplate 样板代码,要输入for(User user : users)
只需输入user.for+Tab - 输入
for(User user : users)
只需输入user.for+Tab - 要输入
Date birthday = user.getBirthday();
只需输入user.getBirthday().var+Tab 即可。
Python 中查看某个模块的用法
Python 命令行输入后,可以使用 help
方法查看方法的用法,例如:
import re
help(re.compile)
复制代码
在控制台输出得到该方法的描述信息:
Python 不忽略首行
Python 处理 csv 文件时,pandas.read_csv(“data.csv”)
默认会将第一行作为标题行信息,不做处理。怎么让它从第一行开始处理呢?header=None
可以达到该目的。
df = pd.read_csv("data.csv", header=None)
复制代码
对象晋升到老年代的过程
对象优先在Eden分配,且新生代对象晋升到老年代有多种情况 (1)、Eden 区满时,进行 Minor GC,当 Eden 和一个 Survivor 区中依然存活的对象无法放入到 Survivor 中,则通过分配担保机制提前转移到老年代中。 (2)、若对象体积太大, 新生代无法容纳这个对象,-XX:PretenureSizeThreshold 即对象的大小大于此值, 就会绕过新生代, 直接在老年代分配, 此参数只对 Serial 及 ParNew 两款收集器有效。 (3)、存活期限长的对象直接进入老年代。
Python 边遍历边删除
边遍历边删除数组会导致数组索引范围变化,导致程序出错,这在 Java 中也是需要注意的问题。但是,Python 的数据处理方法提供了一个巧妙的处理方法。 使用 sorted(list)
,会产生一个新的数组,所以据此删除原来数组的元素,不会改变下标,不会出错。即遍历过程中是用 sorted(list)
返回的新数组,而删除是操作原来的数组,即遍历用了一份拷贝,修改完原数据后得到最终需要的结果了。
__name__
的含义
经常看到 Python 会看到 if __name__ == "__main__":
这样的代码,这段代码是什么作用呢,去掉这段代码后,为什么程序不会执行呢?
__name__
是系统内置变量,代表所在模块名字,也即所在文件名。当模块直接运行时,如 demo_list.py 文件被直接运行,__name__
的值为 “__main__”
,所以 if __name__ == "__main__"
: 通常是触发主流程的。
推导式的过程
推导式的过程:是将整个最后的结果再存入容器的,而不是一边遍历一边推导的。 会在推导式执行完成后,一次性将结果写入 tmp_list
变量,而不是执行推导式的过程中就直接写入 tmp_list
变量。
tmp_list = [i for i in num_list if i not in tmp_list]
复制代码
这是无效的,tmp_list 并不是预期推导的值。
解析 ngix 日志按小时统计行数
给定一个 ngix 日志文件,解析时间列并按时间统计每小时的日志行数。日志文件格式为:
192.168.1.1 [22/Oct/2019:23:58:54 +0800] "POST /dasdhj/sadqwda/q.log HTTP/1.1" 200 133 0.022 "-" "Apache-HttpClient/4.3.3 (java 1.5)" "-"
复制代码
编写 Shell 解析命令为:
awk "{ print $2}" ngix.log | awk -F ":" "{a[$2]=a[$2]+1} END {for(i in a) { print "time:",i,"count:",a[i]}}"
复制代码
思路:
- 先进对日志按空格分割,得到第二列的日志记录时间戳列
- 再对时间列按冒号分割,得到时间列,并按时间列累加
- 输出时间和累加值
input 表单不触发 onclick 事件
一个简单的触发隐藏一个 h1 标签的事件,但是没有执行,代码为:
<h1 id="EleId">请点击此文本!</h1>
<input type="button" value="点击隐藏" οnClick="alert("111");">
复制代码
反复测试,最终确认是 input 的用法错误了,使用 button 按钮元素就可以了:
<button id="clear-button" onclick="clearInput();">点击隐藏</button>
复制代码
线程池关闭导致 AtomicInteger 计数不准确问题
AtomicInteger
类是使用 CAS 原则来实现对数值类型的原子操作的,而且并发效率比 synchronized
高很多。今天看到一个因为线程池提前关闭,导致任务中对 AtomicInteger
计数操作未执行,进而打印的计数值不准确的问题。
这个问题侧面验证了原子类的高效,此外,还有一个知识点是关于 ConcurrentLinkedQueue
类的,判断队列是否还有元素,应该使用 isEmpty()
,而非 size()
。因为是链表,size 操作需要遍历列表统计元素总数;而 isEmpty()
直接判断 first 是否为 null ,效率比前者高。
ajax 请求 415 问题
SSM 项目中出现 ajax 415,出现了请求类型为 json 时后台 415 的问题,这个主要是提交请求时的文件类型和 SpringMVC 配置的类型不一致导致的:
- type:json
- 后台要指定 medias 包含 json 类型