怎么用Python datacompy找出两个DataFrames不同的地方
导读:本文共989字符,通常情况下阅读需要3分钟。同时您也可以点击右侧朗读,来听本文内容。按键盘←(左) →(右) 方向键可以翻页。
摘要: x表:让x1和x2都是x的副本,则此时x1和x2的值是相同:x1=x.copy()x2=x.copy()将其中x2的一个数据赋值为2000x2.loc['罗梓烜']['20220125']=2000x1[x1==x2].head(25)#如何对不相等的数据进行纠正此时可以看到下图这个数据是NaN值,说明对于这个数据来说x1和x2... ...
音频解说
目录
(为您整理了一些要点),点击可以直达。x表:
让x1和x2都是x的副本,则此时x1和x2的值是相同:
x1=x.copy()x2=x.copy()
将其中x2的一个数据赋值为2000
x2.loc['罗梓烜']['20220125']=2000
x1[x1==x2].head(25)#如何对不相等的数据进行纠正
此时可以看到下图这个数据是NaN值,说明对于这个数据来说x1和x2是不相同的
x1[x1==x2].isnull().sum()
下图说明在20220125
这一列当中存在一个NaN
值,也就是我们刚刚赋值的地方:
但是现在还是不能确定出有异常值(也就是不相等的值的那行数据),因此我们考虑使用datacompy
安装:
pipinstalldatacompy
importdatacompy,pandasaspd,syscompy=datacompy.Compare(x1,x2,on_index=True)compyprint(compy.matches())print(compy.report())
此时就可以很清晰的看到两个DataFrame当中不相同的值了:
</div> <div class="zixun-tj-product adv-bottom"></div> </div> </div> <div class="prve-next-news">
本文:
怎么用Python datacompy找出两个DataFrames不同的地方的详细内容,希望对您有所帮助,信息来源于网络。