比如,一段文本:
eng li aas ddde iiiiideeeeef
怎样在Python中用正则表达式提取出尖括号之外的内容?
即最后的输出结果为eng li aas d dde iiiii deeeeef
问题更正,文本应该是这样的:
<SPAN><P>eng li aas<SS>ddde<AP>iiiiideeeeef<P>
怎样在Python中用正则表达式提取出尖括号之外的内容?
即最后的输出结果为eng li aas d dde iiiii deeeeef
替换掉就好了。
re.sub(r'<[A-Z]+>',' ',‘<SPAN><P>eng li aas<SS>ddde<AP>iiiiideeeeef<P>
’)
或者:
>>> ' '.join(re.split(r'<[A-Z]+>','<SPAN><P>eng li
aas<SS>ddde<AP>iiiiideeeeef<P>'))
' eng li aas ddde iiiiideeeeef '
>>>
本回答被网友采纳