函数 | 作用 |
---|---|
pd.merge | 数据合并(类似于SQL中的join操作) |
pd.concat | 数据连接 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
# 数据合并 df = pd.merge(left. right, on='uid', how='left') ''' Args: left: mergw的左表 right: merge的右表 on: 合并时对齐的列名(合并后用来对齐的列名只会在结果中出现一次),如果两表列名相同则指定on,否则要指定left_on和right_on left_on: 左表对齐的列名 right_on: 右表对齐的列名 how: 有四种方式 'left': 左表全部保留,右表丢弃无法与左表合并的内容 'right': 右表全部保留 'inner': 取交集,仅保留两表中都有的内容 'outer': 取并集,只要在两表中出现过的都会保留 ''' # 数据连接 result = pd.concat([df1, df4], axis=0, sort=False) ''' Args: objs: 要连接的dataframes,用列表的形式表示 axis: axis=0为按行连接,axis=1为按列连接 sort: 是否对结果排序 join: 默认为'outer',即两表内容均保留 ''' |