首页 > 文章列表 > pandas中join()的两种应用方法

pandas中join()的两种应用方法

Python
445 2022-08-07

pandas中join()方法很神奇,join()方法虽然是连接方法,但是因为pandas有两个数据结构,join()方法针对两个数据结构有着不同的连接方法:1、根据指定的分隔符将Series中的各个元素的字符串连接起来。通过索引或指定列来连接DataFrame。

方式一:根据指定的分隔符将Series中的各个元素的字符串连接起来。

import pandas as pd
s = pd.Series(['A', 'B', 'C', 'Aaba', 'Baca', 'CABA', 'dog', 'cat'])
print(s.str.join(","))
0          A
1          B
2          C
3    A,a,b,a
4    B,a,c,a
5    C,A,B,A
6      d,o,g
7      c,a,t
dtype: object

方式二:通过索引或指定列来连接DataFrame。

'''可以通过将两边的key进行set_index'''
df_set_index = df_AA.set_index('zh').join(df_ZZ.set_index('en'),how='outer',
                                          lsuffix='_A',rsuffix='_Z')    

'''或设置后边df中key,通过on与指定的左边df中的列进行合并,返回的index不变'''
df_set_index_on = df_AA.join(df_ZZ.set_index('en'), on='zh', how='outer',
                             lsuffix='_A',rsuffix='_Z')

(推荐操作系统:windows7系统、Python 3.9.1,DELL G3电脑。)