python正则表达式提取某段信息后，如何去掉这些信息中含有的某些信息

比如我要提取有....中这两个字中间的信息。
但假如这中间信息含有干燥剂或者发明了。。技术，我就不想要这条信息，不提取这整条信息。
该怎么做，有大神会吗

推荐答案 2018-08-03

这个压根用不上正则表达式。
比如你要提取“有......中”中间的信息，直接用字符串截取不就行了，因为你的是没有规则的字符串。
假如这中间信息含有干燥剂或者发明了。。技术 ---这个可以通过查找字符串，去做判断，判断之后再决定是否要提取这整条信息。追问

不用正则表达式，用什么代码来进行字符串截取呢
又不知道需要文字的位子，拿什么截取

温馨提示：答案为网友推荐，仅供参考

当前网址：http://00.wendadaohang.com/zd/ejrDj0jeeTe0rrIBZj.html

其他回答

第1个回答 2018-08-03

筛选两遍，第一遍以非贪婪模式找出所有匹配有...中的字符串，第二遍剔除其中含有非法字符的匹配结果。

test_str = '有干燥剂中有干燥中有发明了XX技术中有发明了XX中'
regex1 = r'有(.+?)中' #匹配所有'有...中'之间的字符
pre_match = re.findall(regex1, test_str) #结果：['干燥剂','干燥','发明了XX技术','发明了XX']
regex2 = r'(?!.*干燥剂)(?!.*发明了.+技术)' #不能含有干燥剂和发明了..技术字样
final_match = [s for s in pre_match if re.match(regex2, s)] #结果：['干燥','发明了XX']

本回答被提问者采纳

相似回答

python中如何使用正则表达式从字符串中删除特定字符?答：可以使用 one_str.replace("EventApplyCheckIn:\/\/", "") 把它替换为空就好

python正则表达式去掉网址数字l答：您既可以使用黑名单替换所有不需要的字符，也可以对所有希望允许的字符使用白名单，仅保留这些字符。在python中，所谓的“正则表达式”指的是通常被用来检索、替换那些符合某个模式的一段文本。具体而言，它的作用是检测某个字符串是否符合规则和提取网页字符串中想要的数据。

...用python抓取前N个页面,网址后面的怎么去掉?百度版本和以前不一样...答：找到的字符串用正则匹配 ([^/]+)/.* 不含/后面的东西的字符串在捕获括号中，如果要去除 &后面的东西也类似：([^&]+)&.看了你的代码，更改如下：匹配表达式的一部分：class="f13">(.*?) 如果要去掉 ...改为：ass="f13">(.*?)\.{3} 如果要去掉 /后面的东西，...

python中利用正则表达式的删除特定字符的问题答：python中利用正则表达式的删除特定字符的问题匹配"&&"或"||",要求其前或后必须是空白或前面是等号或前或后是"&&""||"本身举几个例子"=&&aaaa"中的"&&""aaaa&&||bbbb"中的"&&||""bbbb||"中的"||"总之就是把前或后没有表达式的&&或... 匹配"&&"或"||",要求其前或后必须是空白或前面是等号...

大家正在搜

正则表达式提取字符串后判断提取函数名python正则 excel正则表达式提取 java正则表达式详解 python提取字符串 python提取字符串指定内容 python提取特定字符串正则表达式生成正则表达式提取字符串