Python中如何用正则表达式获取指定内容

<span>男 23岁(1993年3月) 4年工作经验 大专 未婚</span>这个标签里面的"大专"这个内容如何用正则表达式匹配出来?注意上面的性别,年龄,工作经验都是会变的,不是固定的。该如何写正则表达式呢里面html的空格无法显示出来因此附上一张图

你要先学会分析网页,

截图截的太少了,你说内容都会变,却只放出这么多来,这样谁也写不出来。

只能写出固定的。

text="<span>男 23岁(1993年3月) 4年工作经验 大专 未婚</span>"
a=re.findall('工作经验 (.*?) 未婚',text,re.S)
print(a)

追问

因为文中相似的标签会很多,所以我通过class匹配到了唯一的一个标签这样只要匹配里面的内容就可以了。给的内容多反而你不好找。这是一份简历的HTML,我说的内容会变指的是,像有些简历有可能是女,年龄可能不是23岁啊,工作年限人家可能写1年啊之类的。之所以强调就是这个原因了

追答

网页地址是什么啊。我看一下。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2016-07-31
<span>.*&nbsp;+([^&nbsp;]+?)&nbsp;+.*?<\/span>

追问

我试了一下你的这个方法,还是匹配到了工作经历那个内容而不是学历那个内容。可能这个比较难吧。不过还是谢谢你。

追答

我这里是可以匹配到大专的

相似回答