Python Pandas中DataFrame.drop_duplicates()怎么删除重复值(pandas,python,开发技术)

时间:2024-05-09 19:58:56 作者 : 石家庄SEO 分类 : 开发技术
  • TAG :

语法

df.drop_duplicates(subset=None,keep='first',inplace=False,ignore_index=False)

参数

1.subset:指定的标签或标签序列,仅删除这些列重复值,默认情况为所有列

2.keep:确定要保留的重复值,有以下可选项:

first:保留第一次出现的重复值,默认

last:保留最后一次出现的重复值

False:删除所有重复值

3.inplace:是否生效

4.ignore_index:如果为True,则重新分配自然索引(0,1,…,n - 1)

#删除重复值DataFrame.drop_duplicates()importpandasaspddf=pd.DataFrame([['x','x',1],['x','x',1],['z','x',2]],columns=['A','B','C'])#删除重复行res1=df.drop_duplicates()#删除指定列res2=df.drop_duplicates(subset=['A'])#保留最后一个res3=df.drop_duplicates(subset=['A'],keep='last')

结果展示

df

Python Pandas中DataFrame.drop_duplicates()怎么删除重复值

res1

Python Pandas中DataFrame.drop_duplicates()怎么删除重复值

res2

Python Pandas中DataFrame.drop_duplicates()怎么删除重复值

res3

Python Pandas中DataFrame.drop_duplicates()怎么删除重复值

扩展:识别重复值

importpandasaspddf=pd.DataFrame({'studentID':['A001','A002','A003','A004','A005','A006','A006'],'score':[100,93,94,96,93,95,95]})#识别重复值duplicate_value=df[df.duplicated()]

df

Python Pandas中DataFrame.drop_duplicates()怎么删除重复值

由上图可知studentID为'A006'的记录有两条,我们可以使用duplicated()方法识别重复值,它返回的是布尔值结果(True:有重复值,False:无重复值)

Python Pandas中DataFrame.drop_duplicates()怎么删除重复值

duplicate_value

Python Pandas中DataFrame.drop_duplicates()怎么删除重复值

 </div> <div class="zixun-tj-product adv-bottom"></div> </div> </div> <div class="prve-next-news">
本文:Python Pandas中DataFrame.drop_duplicates()怎么删除重复值的详细内容,希望对您有所帮助,信息来源于网络。
上一篇:封装Vue第三方组件的技巧有哪些下一篇:

12 人围观 / 0 条评论 ↓快速评论↓

(必须)

(必须,保密)

阿狸1 阿狸2 阿狸3 阿狸4 阿狸5 阿狸6 阿狸7 阿狸8 阿狸9 阿狸10 阿狸11 阿狸12 阿狸13 阿狸14 阿狸15 阿狸16 阿狸17 阿狸18