python正则表达式提取多个匹配内容

比如,一段文本:
eng li aas ddde iiiiideeeeef
怎样在Python中用正则表达式提取出尖括号之外的内容?
即最后的输出结果为eng li aas d dde iiiii deeeeef
问题更正,文本应该是这样的:
<SPAN><P>eng li aas<SS>ddde<AP>iiiiideeeeef<P>
怎样在Python中用正则表达式提取出尖括号之外的内容?
即最后的输出结果为eng li aas d dde iiiii deeeeef

替换掉不就行咯,像这样:
re.sub(r'<[A-Z]+>',' ',‘<SPAN><P>eng li aas<SS>ddde<AP>iiiiideeeeef<P>
’)
或者:
>>> ' '.join(re.split(r'<[A-Z]+>','<SPAN><P>eng li aas<SS>ddde<AP>iiiiideeeeef<P>'))
' eng li aas ddde iiiiideeeeef '
>>>
温馨提示:答案为网友推荐,仅供参考
第1个回答  2018-04-08

替换掉就好了。

re.sub(r'<[A-Z]+>',' ',‘<SPAN><P>eng li aas<SS>ddde<AP>iiiiideeeeef<P>

’)

或者:

>>> ' '.join(re.split(r'<[A-Z]+>','<SPAN><P>eng li

aas<SS>ddde<AP>iiiiideeeeef<P>'))

'  eng li aas ddde iiiiideeeeef '

>>>

本回答被网友采纳
第2个回答  2015-02-15

本回答被提问者采纳