题目描述
请实现一个函数用来匹配包括’.’和’*‘的正则表达式。模式中的字符’.’表示任意一个字符,而’*‘表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串”aaa”与模式”a.a”和”ab*ac*a”匹配,但是与”aa.a”和”ab*a”均不匹配
解题思路
- 总体上,分为两种情况:模式中第二个字符不是‘*’、模式中第二个字符是‘*’。第一种情况,检查字符串首位和模式首位字符是否相匹配,成功则均后移一位,失败则返回False。第二种情况,需要分为三种情况:‘*’前面的字符匹配多次(贪婪匹配)、匹配1次、匹配0次,分别对字符串和模式进行相应后移。
- 《剑指Offer》原文:
- 特殊输入测试:空字符串、空模式、含’.’模式、含’*‘模式、普通模式。
代码
Python(2.7.3)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27# -*- coding:utf-8 -*-
class Solution:
# s, pattern都是字符串
def match(self, s, pattern):
# write code here
if not pattern:
if not s:
# 都空返回True
return True
else:
return False
if pattern[0] == '*':
return False
if len(pattern) > 1 and pattern[1] == '*':
# 模式第二位为*的情况
if (len(s) > 0 and (s[0] == pattern[0] or pattern[0] == '.')):
# *之前的字符与s首位相符且s不为空:递归调用贪婪匹配(将字符串后移一位,模式不变)或匹配到0次(字符串不变,模式后移两位)。(不用考虑匹配1次:相当于递归中贪婪匹配的匹配0次)
# 本来考虑这里只需要递归self.match(s[1:], pattern),其实需要将这两种都加上,见后文【经典测试用例】。此处两种对应贪婪匹配、匹配0次
return self.match(s[1:], pattern) or self.match(s, pattern[2:])
else:
# *之前的字符与s首位不符或者s为空,直接将模式后移两位递归,相当于匹配到0次
return self.match(s, pattern[2:])
elif (len(s) > 0 and (s[0] == pattern[0] or pattern[0] == '.')):
# 模式第二位不是*的情况:匹配到就都后移一位递归,未匹配到就返回False
return self.match(s[1:], pattern[1:])
else:
return False运行时间:25ms
占用内存:5736k
经典测试用例
用例:s = 'bbbba', pattern = '.\*a\*a'
如果前面只递归调用self.match(s[1:], pattern)
,那么相当于贪婪匹配,只要模式是.*
就一直缩减s进行递归,到最后s为空时返回False。加上self.match(s, pattern[2:])
后,相当于字符串不变,模式向后缩两位,对于s = 'a', pattern = 'a\*a'
即可返回True。所以二者缺一不可。
不需要加self.match(s[1:], pattern[2:])
的原因是贪婪匹配的递归中的匹配0次相当于匹配1次。
参考
https://www.nowcoder.com/profile/7165145/codeBookDetail?submissionId=12509063