如何使用 Replace Pioneer 2.2 一次性删除10万行TXT文档前面的顺序(列如编号1-100000) 我要全部删掉!

如我的是这样的文档

1 我
2 我
3 我
4 我

我要把全面的1~4全部一次性删除 我的文档是TXT格式的,有几十万行前面的编号都不同 但是几十万行当中却有N多重复的 本来我想去重的但是因为前面编号不同又去不了 因为就算几条句子相同 例如 1我要天天睡大觉 8784 我要天天睡大觉 7687676 我要天天睡大觉 现在我想先把前面的编号去掉然后再去重解决这问题 如果能找到一个方法能去重就好了 TXT格式的

第1个回答  2013-09-01
========================
方法一:

有了Replace Pioneer,你不用删除前面的序号就可以去除重复行,以下是详细步骤:

1. ctrl-o打开文件
2. 打开菜单Replace->Replace by template->Line Replace->Remove all duplicate Lines
3. 把下面的Run Following for each matched unit的内容改为:

if (get_value(words($match,2,-1))==1 ) { $A=""; }
else {$A="$match\n"; set_value(words($match,2,-1),1); }

4. 点击ok, 点击replace,完成, 按ctrl-s存盘。

========================
方法二:

同时,这里也顺便提供另一方法先删除前面的序号,再删除重复行:
1. ctrl-o打开文本文件
2. ctrl-h打开Replace窗口
把Replace Unit选成Chars
把Replace Scope选成Line
在Search for pattern输入"^\d+\s+"(不带双引号)
3. 点击Replace,删除序号完成.
4. 打开菜单Replace->Replace by template->Line Replace->Remove all duplicate Lines
5. 点击ok, 点击replace,完成, 按ctrl-s存盘。