脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - python正则表达式中的re库常用方法总结

python正则表达式中的re库常用方法总结

2022-08-29 14:24小陈在广师打王者 Python

这篇文章主要介绍了python正则表达式中的re库常用方法总结文章围绕主题展开详细的内容介绍,具有一定的参考价值,感兴趣的小伙伴可以参考一下

元字符 :

python正则表达式中的re库常用方法总结

预定义字符集

python正则表达式中的re库常用方法总结

我进行组合一些复杂的正则表达式的时候是为了快捷去晚上找一些现成的模式,然后再自己进行修改,变成符合自己需要的一些正则表达式。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
import re
 
# 正则表达式中的一些使用的符号
 
# 匹配出现符合条件的 0 次的或者是 多次
 
str1 = 'qwertyuio1ui3oo467j398k'
 
#  关键词: *    下面的句子就是进行匹配 零次 或者是 多次(多个字符) 符合是数字的意思
pattern = re.compile(r'd*')
res = re.findall(pattern, str1)
print(res)
""""
显示的结果:
['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', '']
"""
# 关键词: +  匹配一次或者是多次的结果
 
pattern = re.compile(r'd+')
res = re.findall(pattern, str1)
print(res)
"""
显示结果:
['1', '3', '467', '398']
"""
 
# 关键词: ?  匹配0次或者是1次的结果
 
pattern = re.compile(r'd?')
res = re.findall(pattern, str1)
print(res)
"""
['', '', '', '', '', '', '', '', '', '1',
'', '', '3', '', '', '4', '6', '7', '',
'3', '9', '8', '', '']
"""
 
# {m}精确匹配m次  (比如写进去的3,那么他就是匹配到是3个数字字符串的所有小字符串)
pattern = re.compile(r'd{3}')
res = re.findall(pattern, str1)
print(res)
# 结果:['467', '398']
 
# {m, n} 最少匹配m次,最多匹配n次
# 记住在{}里面是不能随便加上空格的?
pattern = re.compile(r'd{1,3}')
res = re.findall(pattern, str1)
print(res)
# 结果:['1', '3', '467', '398']

match()函数只检测 目标字符(串) 是不是在string的开始位置匹配,search()会扫描整个string查找匹配, match()只有在0位置匹配成功才会有返回,如果不是开始位置匹配成功,match()就会返回None

代码解释:

import re

m = re.match('lsp','hhttlsp')

if m is not None

        print(m.group())

else:

        print('noneFine')

显示结果:

noneFine

n = re.search('lsp','hhttlsp')

if n is not None:

        print(n.group())

else:

        print(noneFine')

显示结果:

lsp

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import re
n = re.search('lsp','hhttlsp')
if n:
    print(n.group())
else:
    print('noneFine')
# 显示结果:
# lsp
m = re.match('lsp','hhttlsp')
if m:
    print(m.group())
else:
    print('noneFine')
# 显示结果:
# noneFine

python的re库有两个函数/方法用于实现搜索和替换功能: sub()和subn().两者几乎一样,都是将某字符串中所有匹配正则表达式的部分进行某种形式的替换.用来替换的部分通常是一个字符串,但它也可能是一个函数,该函数返回一个用来替换的字符串.subn()和 sub()一样,但subn()还返回一个表示替换的总数,替换后的字符串和表示替换总数的数字一起作为一个拥有两个元素的元组返回.

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# 可以使用sub()方法来进行查询和替换,sub方法的格式为:
# sub(replacement, string[, count=0])
# replacement是被替换成的文本
# string是需要被替换的文本
# count是一个可选参数,指最大被替换的数量
 
# 下面进行将所有的数字给进行替换掉
pattern = re.compile(r'd')
res = re.sub(pattern, '替换掉的数字  ',str1)
print(res)
# 下文结果,为了方便大家看到换了多少个数字,我使用了换行将字符串给换行看出有几次换了数字
"""
qwertyuio替换掉的数字 
ui替换掉的数字 
oo替换掉的数字 
替换掉的数字 
替换掉的数字 
j替换掉的数字 
替换掉的数字 
替换掉的数字  k
"""
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 加上显示修改了多少次
res = re.subn(pattern, '替换掉的数字  ',str1)
print(res)
"""
结果:
('qwertyuio替换掉的数字
 ui替换掉的数字 
 oo替换掉的数字
  替换掉的数字
   替换掉的数字 
   j替换掉的数字 
   替换掉的数字
    替换掉的数字 
    k', 8)
"""

re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,则返回一个列表,否则返回原string列表;

  • 第1个参数:正则表达式
  • 第2个参数:要匹配查找的原始字符串;
  • 第3个参数:可选参数,表示最大的拆分次数,默认为0,表示全部分割;
  • 第4个参数:可选参数,标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等;

特别注意: 此方法并不是完全匹配。它仅仅决定在字符串开始的位置是否匹配。所以当pattern结束时若还有剩余字符,仍然成功。若想进行完全匹配,可以在表达式末尾加上边界匹配符'$'

?
1
2
3
4
5
6
str2 = '自然语言处理123机器学习456深度学习'
pattern = re.compile(r'd+')
res = re.split(pattern, str2)
print(res)
# 结果:
# ['自然语言处理', '机器学习', '深度学习']

Python的re模块是第一个提出解决方案的模块:命名捕获组和命名后向引用。(?P <name> group)将组的匹配捕获到后向引用“名称”中。

?
1
2
3
4
5
6
str2 = '自然语言处理123机器学习456深度学习'
pattern = re.compile(r'(?P<dota>d+)(?P<lsp>D+)')
m = re.search(pattern, str2)
print(m.group('lsp'))
# 结果为:
# 机器学习
?
1
2
3
4
5
6
str2 = '自然语言处理123机器学习456深度学习'
pattern = re.compile(r'(?P<dota>d+)(?P<lsp>D+)')
m = re.search(pattern, str2)
print(m.group('dota'))
# 结果为:
# 123

进行号码的筛选,小尝试:

?
1
2
3
4
5
6
7
# 筛选号码
str3 = 'number  132-3209-*******'
pattern = re.compile(r'(ddd-dd)')
res = re.search(pattern, str3)
print(res.group())
# 显示结果:
# 132-32

全部代码:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
# -*- coding:utf-8 -*-
# @Author : DaFuChen
# @File : demo1.py
# @software: PyCharm
 
import re
 
# 正则表达式中的一些使用的符号
 
# 匹配出现符合条件的 0 次的或者是 多次
 
str1 = 'qwertyuio1ui3oo467j398k'
 
#  关键词: *    下面的句子就是进行匹配 零次 或者是 多次(多个字符) 符合是数字的意思
pattern = re.compile(r'd*')
res = re.findall(pattern, str1)
print(res)
""""
显示的结果:
['', '', '', '', '', '', '', '', '', '1', '', '', '3', '', '', '467', '', '398', '', '']
"""
 
# 关键词: +  匹配一次或者是多次的结果
 
pattern = re.compile(r'd+')
res = re.findall(pattern, str1)
print(res)
"""
显示结果:
['1', '3', '467', '398']
"""
 
# 关键词: ?  匹配0次或者是1次的结果
 
pattern = re.compile(r'd?')
res = re.findall(pattern, str1)
print(res)
"""
['', '', '', '', '', '', '', '', '', '1',
'', '', '3', '', '', '4', '6', '7', '',
'3', '9', '8', '', '']
"""
# {m}精确匹配m次  (比如写进去的3,那么他就是匹配到是3个数字字符串的所有小字符串)
pattern = re.compile(r'd{3}')
res = re.findall(pattern, str1)
print(res)
# 结果:['467', '398']
 
# {m, n} 最少匹配m次,最多匹配n次
# 记住在{}里面是不能随便加上空格的?
pattern = re.compile(r'd{1,3}')
res = re.findall(pattern, str1)
print(res)
# 结果:['1', '3', '467', '398']
 
import re
 
n = re.search('lsp','hhttlsp')
if n:
    print(n.group())
else:
    print('noneFine')
# 显示结果:
# lsp
 
m = re.match('lsp','hhttlsp')
if m:
    print(m.group())
else:
    print('noneFine')
# 显示结果:
# noneFine
 
# 可以使用sub()方法来进行查询和替换,sub方法的格式为:
# sub(replacement, string[, count=0])
# replacement是被替换成的文本
# string是需要被替换的文本
# count是一个可选参数,指最大被替换的数量
 
# 下面进行将所有的数字给进行替换掉
pattern = re.compile(r'd')
res = re.sub(pattern, '替换掉的数字  ',str1)
print(res)
# 下文结果,为了方便大家看到换了多少个数字,我使用了换行将字符串给换行看出有几次换了数字
"""
qwertyuio替换掉的数字 
ui替换掉的数字 
oo替换掉的数字 
替换掉的数字 
替换掉的数字 
j替换掉的数字 
替换掉的数字 
替换掉的数字  k
"""
 
# 加上显示修改了多少次
res = re.subn(pattern, '替换掉的数字  ',str1)
print(res)
"""
结果:
('qwertyuio替换掉的数字
 ui替换掉的数字 
 oo替换掉的数字
  替换掉的数字
   替换掉的数字 
   j替换掉的数字 
   替换掉的数字
    替换掉的数字 
    k', 8)
"""
str2 = '自然语言处理123机器学习456深度学习'
pattern = re.compile(r'd+')
res = re.split(pattern, str2)
print(res)
# 结果:
# ['自然语言处理', '机器学习', '深度学习']
str2 = '自然语言处理123机器学习456深度学习'
pattern = re.compile(r'(?P<dota>d+)(?P<lsp>D+)')
m = re.search(pattern, str2)
print(m.group('dota'))
# 结果为:
# 123
 
# 筛选号码
str3 = 'number  132-3209-*******'
pattern = re.compile(r'(ddd-dd)')
res = re.search(pattern, str3)
print(res.group())
# 显示结果:
# 132-32

到此这篇关于python正则表达中的re库常用方法总结的文章就介绍到这了,更多相关python re库内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/blockshowtouse/article/details/126573110

延伸 · 阅读

精彩推荐
  • Pythonpython中os.path.join()函数实例用法

    python中os.path.join()函数实例用法

    在本篇文章里小编给大家整理的是一篇关于python中os.path.join()函数实例用法,有兴趣的朋友们可以跟着学习参考下。...

    小妮浅浅8622021-11-13
  • Pythonopencv 阈值分割的具体使用

    opencv 阈值分割的具体使用

    这篇文章主要介绍了opencv 阈值分割的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随...

    总裁余6252020-07-09
  • PythonPython中的rjust()方法使用详解

    Python中的rjust()方法使用详解

    这篇文章主要介绍了Python中的rjust()方法使用详解,是Python学习入门中的基础知识,需要的朋友可以参考下 ...

    脚本之家7972020-07-02
  • Python深入了解Python数据类型之列表

    深入了解Python数据类型之列表

    下面小编就为大家带来一篇深入了解Python数据类型之列表。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧 ...

    Python教程网3022020-08-29
  • Python详解anaconda离线安装pytorchGPU版

    详解anaconda离线安装pytorchGPU版

    这篇文章主要介绍了详解anaconda离线安装pytorchGPU版,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下...

    thinking慢羊羊15952020-09-09
  • Pythonpython基于numpy的线性回归

    python基于numpy的线性回归

    这篇文章主要为大家详细介绍了python基于numpy的线性回归,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    Giao哥不瘦到100不改名10982022-07-30
  • Pythonpython3环境搭建过程(利用Anaconda+pycharm)完整版

    python3环境搭建过程(利用Anaconda+pycharm)完整版

    这篇文章主要介绍了python3环境搭建过程(利用Anaconda+pycharm)完整版,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友...

    DZ_soul5792020-08-19
  • Python使用Python编写一个在Linux下实现截图分享的脚本的教程

    使用Python编写一个在Linux下实现截图分享的脚本的教程

    这篇文章主要介绍了使用Python编写一个在Linux下实现截图分享的脚本的教程,利用到了scrot和urllib2库,需要的朋友可以参考下 ...

    C Wong4402020-06-12