Pd concat là gì

Một sự khác biệt ở mức rất cao là merge() được sử dụng để kết hợp hai (hoặc nhiều) cơ sở dữ liệu trên cơ sở các giá trị của các cột chung (cũng có thể được sử dụng, sử dụng left_index=True và/hoặc right_index=True) và concat() được sử dụng để nối thêm một (hoặc nhiều) datafram bên dưới cái kia (hoặc đi ngang, tùy thuộc vào tùy chọn axis được đặt thành 0 hay 1).

join() được sử dụng để hợp nhất 2 datafram trên cơ sở chỉ mục; thay vì sử dụng merge() với tùy chọn left_index=True chúng ta có thể sử dụng join().

Ví dụ:

df1 = pd.DataFrame({'Key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1': range(7)}) df1: Key data1 0 b 0 1 b 1 2 a 2 3 c 3 4 a 4 5 a 5 6 b 6 df2 = pd.DataFrame({'Key': ['a', 'b', 'd'], 'data2': range(3)}) df2: Key data2 0 a 0 1 b 1 2 d 2 #Merge # The 2 dataframes are merged on the basis of values in column "Key" as it is # a common column in 2 dataframes pd.merge(df1, df2) Key data1 data2 0 b 0 1 1 b 1 1 2 b 6 1 3 a 2 0 4 a 4 0 5 a 5 0 #Concat # df2 dataframe is appended at the bottom of df1 pd.concat([df1, df2]) Key data1 data2 0 b 0 NaN 1 b 1 NaN 2 a 2 NaN 3 c 3 NaN 4 a 4 NaN 5 a 5 NaN 6 b 6 NaN 0 a Nan 0 1 b Nan 1 2 d Nan 2