python如何批量对每一个excel文件进行去重？

如题所述

推荐答案 2022-05-19

01
去重
我们使用Pandas库的drop_duplicates(subset=None, keep=‘first’, inplace=False)功能来对Excel文件中的重复项进行删除。
其中，subset参数代表指定列标记，默认当每一条行记录完全相同时，才会认定为重复行；keep=‘’有‘first’、‘last’和‘False’，意思是删除重复行时，保留first还是last还是全部删除，默认参数是‘first’；inplace=‘’有True和Flase，意思是直接替换还是保留副本,默认值是Flase。
读取Excel
import pandas as pd
df = pd.read_excel('全部.xlsx')

选中列去重
df.drop_duplicates(['用户名称'])

其中第2、3行的用户名称与第0、1行重复，所以被删除。
03
保存最后一个重复数据
df.drop_duplicates(['用户名称'],keep='last')

04
保存Excel
df.to_excel('去重后.xlsx')

02
批量获取Excel文件
在上面我们已经学会如何对单个Excel文件去重了，但是在读取文件名的时候，我们还是需要手动输入的，如果文件很多的话，我们要一个一个的输入，这不仅麻烦，而且也不符合自动化办公的名头。所以，我们就需要想办法取得该目录下的所有Excel文件。
这里我们用的是Pathlib库，取得该目录下所有的xlsx格式文件。
path = 'K:\自动化办公'

温馨提示：答案为网友推荐，仅供参考

当前网址：http://00.wendadaohang.com/zd/TTDenTnZeeIrnnBIrn.html

相似回答

python如何对列表进行去重答：一、使用set转化法去重 将列表转换为集合是一种非常有效的去重方法。集合是一种无序且不重复的数据结构，因此将列表转换为集合会自动去除重复元素。然后，你可以再将集合转回列表。示例如下：python list1 = [1, 2, 2, 3, 4, 3, 5]list1 = list)二、利用Python内置函数去重 你还可以使用Python...

Python列表去重的六种方法答：方法一：利用set的独特性质</ Python内置的set数据结构具有无序且不允许重复元素的特性，我们可以巧妙地利用这个特性来去重。通过将列表转换为set，再转换回list，即可实现去重，尽管set会打乱原有顺序，但这是唯一可能丢失顺序的方法</。方法二：借助字典的键值对</ 利用字典的fromkeys()函数，将列表中的...

python怎么过滤重复的数组?答：python过滤重复数组的技巧主要涉及两种方法：一种是使用np.unique()函数，另一种是利用set()函数。这两种方法都能高效地去除列表中的重复元素。np.unique()函数能对一维数组或列表进行去重操作，并按元素从小到大返回一个无重复元素的新数组或元组。例如，列表lt=[1,212,3,4,2,3,'aa']中存在重复...

Python如何对数据进行去重去空答：Python如何对数据进行去重去空  我来答分享微信扫一扫新浪微博 QQ空间举报可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。 python 搜索资料本地图片图片链接代码提交回答匿名回答自动保存中为你推荐:...

大家正在搜

python处理excel文件用python读取excel文件 python导出excel文件 python写excel文件 python 导入excel文件 python生成excel文件 python怎么读excel文件 python合并多个excel python 读取excel