6.数据整合[Python基础]

以此为例




一.使用concat合并数据

主要参数 接收 作用 默认
axis Boolean 确定合并操作横轴(0行操作,1列操作) 0
Join String 内链接(outer)/外链接(inner) outer

1.行操作(axis=0)

(1)内连接

pd.concat([DataFrame1,...DataFramen])

示例

(2)外连接

pd.concat([DataFrame1,...DataFrameN],join="inner")

示例

2.列操作(axis=1)

(1)内连接

pd.concat([DataFrame1,...DataFrameN],axis=1)

示例

(2)外连接

pd.concat([DataFrame1,...DataFrameN],axis=1,join="inner")

示例

二.使用append合并数据

只限与行操作,纵向操作

DataFrame1.append([DataFrame2,...DataFrameN])

示例

三.重复合并

1.主键重复

(1) merge

参数名 接收 意义 默认
left DataFrame/Series 要添加的新数据1
right DataFrame/Series 要添加的新数据2
how Inner /outer /left /right 数据的连接方式 inner
on String / sequence 两个数据合并的主键 None
left_on String / sequence Left 参数接收合并主键 None
right_on String / sequence right 参数接收合并主键 False
left_index boolean 是否将left参数接受的index作为主键 False
right_on boolean 是否将right参数接受的index作为主键 False
sort boolean 是否根据连接键合并后的数据进行排序 False
suffixes tuple 追加left/right参数接收列名的后缀 (”_x”,”_y”)
pd.merge(DataFrame1,..DataFrameN,on/left_on/right_on=[主键])

示例

(2)join

参数名称 接收 意义 默认
other DataFrame/Series 参与连接的其他DataFrame
on List/tuple 用于连接的列名 None
how String inner内

outer外

left左

right右

inner
lsuffix string 追加左侧重叠列名的尾缀
rsuffix string 追加右侧重叠列名的尾缀
sort boolean 是否合并后排序 Flase
DataFrame1.join(DataFrame2,on=[主键])

2.内容重复

Combing

特点1: 无值,补空值
特点2: 有值,保留DataFrame1的值

DataFrame1.combine_first(DataFrame2)

示例

hmoban主题是根据ripro二开的主题,极致后台体验,无插件,集成会员系统
自学咖网 » 6.数据整合