🎉 pandas数据合并之一文弄懂pd.concat() 📊
在数据分析中,`pd.concat()` 是 pandas 库中最常用的函数之一,用于将多个 DataFrame 或 Series 合并为一个。它简单高效,但若使用不当,可能导致结果不如预期。本文带你彻底搞懂 `pd.concat()` 的用法和注意事项!
首先,`pd.concat()` 支持按行(`axis=0`)或按列(`axis=1`)合并数据。例如:
```python
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})
result = pd.concat([df1, df2]) 默认 axis=0,纵向合并
print(result)
```
此时,`pd.concat()` 会将两个 DataFrame 按索引对齐后合并。若希望保留原索引,可设置参数 `ignore_index=True`。
其次,注意键值对齐问题。如果 DataFrame 的列名不同,合并时可能会出现缺失值(NaN)。例如:
```python
df3 = pd.DataFrame({'C': [9, 10]})
result = pd.concat([df1, df3], axis=1) 横向合并
print(result)
```
此时,`df3` 的列名 `C` 不在 `df1` 中,因此右侧会出现 NaN 值。
最后,别忘了检查合并后的数据是否符合预期!掌握这些技巧后,你就能轻松驾驭 `pd.concat()`,让数据处理事半功倍!✨
免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。