当前位置:网站首页>获取两个dataframe的交并差集

获取两个dataframe的交并差集

2022-06-26 13:56:00 羊羊猪

Example
在这里插入图片描述
在这里插入图片描述

交集

在这里插入图片描述

df_merge = pd.merge(df1,df2,on=['id','name','number'],how='inner')

在这里插入图片描述

并集

在这里插入图片描述

# 两种方式
df_union = pd.merge(df1,df2,on=['id','name','number'],how='outer')
df_union2 = df1.append(df2).drop_duplicates(subset=df1.columns,keep='first',ignore_index=True)

在这里插入图片描述

差集

在这里插入图片描述

# 两种方式
# df1-df2
df_diff1 = df1.append(df1.append(df2)).drop_duplicates(subset=df1.columns,keep=False,ignore_index=True)
df_diff1 = pd.concat([df1,df1,df2]).drop_duplicates(keep=False)

在这里插入图片描述

# 两种方式
# df2 - df1
df_diff2 = df2.append(df2.append(df1)).drop_duplicates(subset=df2.columns,keep=False,ignore_index=True)
df_diff2 = pd.concat([df1,df2,df2]).drop_duplicates(keep=False)

在这里插入图片描述

对称差集

在这里插入图片描述

df_diff = df1.append(df2).drop_duplicates(subset=df1.columns,keep=False,ignore_index=True)

在这里插入图片描述

参考来源

pandas.DataFrame.drop_duplicates 官方文档
pandas.merge 官方文档

原网站

版权声明
本文为[羊羊猪]所创,转载请带上原文链接,感谢
https://blog.csdn.net/weixin_46599926/article/details/125427175