python删除重复数据

如题所述

第1个回答  2021-07-16
利用集合的不重复属性,可以先转换至集合,再用list()函数转换回来即可。
比如,a是一个列表,a=list(set(a)),即可完成列表去重。
第2个回答  2024-03-14
1、使用set()函数去重
set()是Python中的一个内置函数,用于创建一个集合。集合是无序不重复的元素集合,可以方便地用于去重操作。我们可以将要去重的数据转换为集合,然后再转换为列表,即可去除重复数据。示例代码:
```
data = [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9]
data = list(set(data))
print(data)
```
输出结果为:[1, 2, 3, 4, 5, 6, 7, 8, 9]
2、使用pandas库去重
pandas是Python中一种常用的数据处理库,可以方便地进行数据清洗、转换、分析等操作。pandas提供了drop_duplicates()函数,可以用于去除dataframe中的重复数据。示例代码:
```
import pandas as pd
data = {'A': [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9],
'B': ['a', 'b', 'c', 'd', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'h']}
df = pd.DataFrame(data)
df = df.drop_duplicates()
print(df)
```
输出结果为:
```
A B
0 1 a
1 2 b
2 3 c
3 4 d
6 5 c
7 6 d
9 7 f
10 8 g
11 9 h
```
3、使用numpy库去重
numpy是Python中一个常用的科学计算库,可以用于数组操作、线性代数运算等。numpy提供了unique()函数,可以用于去除数组中的重复元素。示例代码:
```
import numpy as np
data = [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9]
data = np.unique(data)
print(data)
```
输出结果为:[1 2 3 4 5 6 7 8 9]
4、使用hash去重
hash是一种将任意长度的消息压缩到某一固定长度的算法。Python中的字典使用了hash表来实现,因此可以利用字典的特性进行去重操作。示例代码:
```
data = [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9]
result = list(dict.fromkeys(data))
print(result)
```
输出结果为:[1, 2, 3, 4, 5, 6, 7, 8, 9]
第3个回答  2023-10-13
1、使用set()函数去重
set()是Python中的一个内置函数,用于创建一个集合。集合是无序不重复的元素集合,可以方便地用于去重操作。我们可以将要去重的数据转换为集合,然后再转换为列表,即可去除重复数据。示例代码:
```
data = [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9]
data = list(set(data))
print(data)
```
输出结果为:[1, 2, 3, 4, 5, 6, 7, 8, 9]
2、使用pandas库去重
pandas是Python中一种常用的数据处理库,可以方便地进行数据清洗、转换、分析等操作。pandas提供了drop_duplicates()函数,可以用于去除dataframe中的重复数据。示例代码:
```
import pandas as pd
data = {'A': [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9],
'B': ['a', 'b', 'c', 'd', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'h']}
df = pd.DataFrame(data)
df = df.drop_duplicates()
print(df)
```
输出结果为:
```
A B
0 1 a
1 2 b
2 3 c
3 4 d
6 5 c
7 6 d
9 7 f
10 8 g
11 9 h
```
3、使用numpy库去重
numpy是Python中一个常用的科学计算库,可以用于数组操作、线性代数运算等。numpy提供了unique()函数,可以用于去除数组中的重复元素。示例代码:
```
import numpy as np
data = [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9]
data = np.unique(data)
print(data)
```
输出结果为:[1 2 3 4 5 6 7 8 9]
4、使用hash去重
hash是一种将任意长度的消息压缩到某一固定长度的算法。Python中的字典使用了hash表来实现,因此可以利用字典的特性进行去重操作。示例代码:
```
data = [1, 2, 3, 4, 1, 2, 5, 6, 3, 7, 8, 9, 9]
result = list(dict.fromkeys(data))
print(result)
```
输出结果为:[1, 2, 3, 4, 5, 6, 7, 8, 9]
相似回答