当前位置:

Python正则表达式的‘r‘

访客 2024-01-05 580 0

Python正则表达式中的’r’

最近遇到一个非常困惑的地方,那就是在使用Python中的正则表达式的时候,正则表达式前面的’r’带来的影响。自己最开始的困惑点在于,’r‘的作用是声明为原始字符串,那么按照此种逻辑,‘\n’匹配的就是换行符,而r’\n’匹配的不就是原始的’\‘和’n’两个字符嘛。但是可以发现r’\n’也可以匹配换行符,这就让笔者感到非常疑惑。经过分析参考,自己得出了一套解释,不一定正确,大家可以作为一定的参考。

importredata="Giveathumbup!\nThankyou!"print(data)print(re.findall('\n',data))print(re.findall(r'\n',data))

发现输出如下所示,可以发现r’\n’依然能够匹配换行符

一、Python字符串前面加’r’

对于Python字符串,前面加’r’的解释较为简单,就是决定一个字符串是否为原生字符串,具体示例如下所示

data1="Giveathumbup!\nThankyou!"print(data1)data2=r"Giveathumbup!\nThankyou!"print(data2)

输入如下所示

二、正则表达式匹配原理

下面给出自己对于正则匹配过程的理解,这部分完全为个人理解,本质上是为了解释文章开始提出的那个奇怪的问题。当我们在程序中定义了一个正则表达式,首先会对给出的字面的正则表达式做一个转换,例如如果定义一个正则表达式为’\\\\‘,那么这个字面的’\\\\‘会进行转义,那么正则表达式里面的值就是’\\‘。此时,正则表达式的值为’\\‘,那么进行匹配时,’\\‘匹配的就是’\‘,第一个’\‘代表转义,所以此时进行匹配,就能够匹配原始字符串中的’\'。程序运行如下

data="Give\Thankyou!"print(data)tmp_str=[]tmp_str.append(data[4])print(tmp_str)print(re.findall('\\\\',data))

程序输入如下所示

为了更好解释匹配原理,画一张图来解释

三、正则表达式前面加’r’

由上述的原理图,那么在正则表达式前面加’r’相当于是原生字符串,会导致正则表达式接受的值就是被赋值的字面值,也就相当于Python解释器不会进行转换了,赋值r’\\‘,那么正则表达式接受的值就是’\\',示例如下所示

data="Giveathumbup\Thankyou!"print(data)print(re.findall(r'\\',data))

运行结果如下

那接下来看一个例子,来理解’\n’有关的问题

data="Giveathumbup\nThankyou!\nMua"print(data)print(re.findall('\n',data))print(re.findall(r'\n',data))print(re.findall('\\n',data))print(re.findall(r'\\n',data))

输出如下

第一种情况,字面为’\n’,那么正则表达式实际接受的值为换行符,换行符直接就可以匹配字符串中的换行符
第二种情况,正则表达式实际接受的值为’\n’,‘\n’在匹配的时候代表换行符,能够匹配出字符串中的换行符
第三种情况,字面值为’\\n’,Pyhton解释器经过解释,对’\\‘进行转义,正则表达式实际接收的值为’\n’,在匹配时能够匹配换行符
第四种情况,为原生字符串,正则表达式实际接收的值为’\\n’,‘\\n’在进行匹配时对’\\‘进行转义,所以匹配的是’\'和’n’两个字符,验证此种情况如下

data=r"Giveathumbup\nThankyou!\nMua"print(data)print(re.findall('\n',data))print(re.findall(r'\n',data))print(re.findall('\\n',data))print(re.findall(r'\\n',data))

发表评论

  • 评论列表
还没有人评论,快来抢沙发吧~