Pandas-通过对列和索引的值求和来合并两个数据框-白红宇

Pandas-通过对列和索引的值求和来合并两个数据框

阅读量：800 次

发布时间：2023-02-26

本文共 1297 字，大约阅读时间需要 4 分钟。

Pandas是Python中一个强大的数据处理库，广泛应用于数据分析和数据操作。在实际工作中，经常需要将多个数据框合并成一个新的数据框，以便更方便地进行数据分析和操作。通过对列和索引的值进行求和或匹配，可以实现数据框的合并，这在数据分析中是一个非常常见的操作。

以下是一个使用Pandas merge函数合并两个数据框的详细示例：

import pandas as pd

创建数据框

首先，我们需要创建两个包含不同数据的数据框。第一个数据框包含客户信息，包括customer_id和name；第二个数据框包含客户的购买历史，包括customer_id和item。

# 创建客户信息数据框customers = pd.DataFrame({    'customer_id': [1, 2, 3, 4],    'name': ['Alice', 'Bob', 'Charlie', 'David']})# 创建购买历史数据框purchases = pd.DataFrame({    'customer_id': [2, 3, 3, 4, 4, 4],    'item': ['Book1', 'Book2', 'Book3', 'Book4', 'Book5', 'Book6']})

合并数据框

接下来，我们使用Pandas提供的merge()函数将这两个数据框合并在一起。默认情况下，merge()函数会基于customer_id这一共同列进行匹配。

# 使用merge()函数合并两个数据框merged_df = pd.merge(customers, purchases, on='customer_id')print(merged_df)

输出结果

运行上述代码后，得到的结果如下：

customer_id  name  item0            1  Alice  Book11            2   Bob   Book22            3  Charlie  Book33            4   David  Book44            4   David  Book55            4   David  Book6

说明

在这个示例中，我们通过pd.merge()函数将两个数据框合并在一起。on='customer_id'参数指定了我们希望基于哪一列进行匹配。在合并后的数据框中，customer_id列保持不变，而name和item列则来自customers数据框。这样，我们可以清晰地看到每个客户的名字及其购买的物品。

合并方式的灵活性

需要注意的是，Pandas的merge()函数非常灵活，可以根据具体需求选择不同的合并方式。例如：

内连接：只保留两个数据框在两个键列都存在的行。

左连接：只保留左边数据框在两个键列中存在的行。

右连接：只保留右边数据框在两个键列中存在的行。

全外连接：保留两个数据框中所有存在的键值对。

这种灵活性使得Pandas在数据处理任务中非常强大，能够应对各种复杂的数据合并需求。

转载地址：http://zpvfk.baihongyu.com/

你可能感兴趣的文章