20200110-正则表达式
在自动化办公的时候,经常遇到需要通过正则表达式来处理文本。
1、环境是python, 开发工具是pycharm
2、需要导入re模块, 并且不需要安装,直接导入即可使用, 用到方法; ref.findall(patter, str)
3、简单语法介绍:
— re.findall(“aa”, str) # 找找“aa”字符串
— 查找除了换行以外的任何字符: .
— 查询重复子: *: 代表0-多次重复,0次用“”表示
–查找重复字: + : 代表 1到多次重复
— |: 代表或的关系: 查找aa 或者bb的字符:
— []: 代表要匹配的字符,[0-9] 代表匹配0-9的数字;[a-z]: 代表匹配26个小写英文字符;[A-Z]: 代表匹配26个大写因为字符;[0-9a-zA-Z] 表示: 匹配0-数字26个大小写因为字符都会被找出来
— {m, n} 代表匹配几次:表示匹配m次,到n次, 最少m次,最大m次; 和这几个元字符比较相似: * 代表匹配{0,}; + 代表{1,};?代表:{0,1}
— ?代表:{0,1}
— 匹配一个手机号, 特性: 11位、数字, 1开头
–匹配非字符: ^
–匹配字符串的开头:^; 匹配字符串的结尾: $
— ? : 代表匹配前面表达式0-1次,即前面是小写26个英文字母,加上?代表小写字符出现0-1次都属于匹配范围
— dD d:匹配任何数字字符 D:匹配任意非字符数字
— 匹配任意(非)普通字符: w: 代表普通字符(比如:数字字母下划线汉字); W:非普通 如:*&%¥#等
— 匹配任意(非)空字符: s: 匹配空字符 S 匹配非空字符 说明: 空字符是指 空格
vf字符