使用pd.merge表连接出现多余行如何解决
导读:本文共743字符,通常情况下阅读需要2分钟。同时您也可以点击右侧朗读,来听本文内容。按键盘←(左) →(右) 方向键可以翻页。
摘要: 利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。paperPublicationIndicator=pd.merge(paperPublication,publicationIndicator,how='left',left_on='出版物',rig... ...
音频解说
目录
(为您整理了一些要点),点击可以直达。利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。
paperPublicationIndicator=pd.merge(paperPublication,publicationIndicator,how='left',left_on='出版物',right_on='名称',sort=False)
结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:
出版物名称指标出版物A出版物A指标1出版物A出版物A指标2#多余的行
这里选择预先删除 表2出版物指标 中的重复出版物信息。
publicationIndicator.drop_duplicates(subset=['名称'], keep='first',inplace=True)
</div> <div class="zixun-tj-product adv-bottom"></div> </div> </div> <div class="prve-next-news">
本文:
使用pd.merge表连接出现多余行如何解决的详细内容,希望对您有所帮助,信息来源于网络。