↓폴밍끼 유튜브 채널 자세히보기

Python library & package/Pandas

같지만 데이터의 순서가 다른 공통 컬럼을 가진 판다스 데이터 프레임(dataframe) 병합이(merge) 가능한가?

폴밍끼 2021. 4. 1. 18:18
728x90

일단 결론부터 말하면, 알아서 잘 병합된다. (그런데 데이터가 일부는 같고 일부는 서로 다르다면 서로 다른 부분은 제외하고 공통인 부분만 병합이 됨. 그래서 행 수가 그만큼 줄어듦.)

예를 들어 보자.

student_card1 = pd.DataFrame({'ID':[20190103, 20190222, 20190531],
                             'name':['Kim', 'Lee', 'Jeong'],
                             'class':['H', 'W', 'S']})
student_card1

student_card2 = pd.DataFrame({'ID':[20190222, 20190531, 20190103],
                             'age':[20, 21, 22]})
student_card2

student_card1과 student_card2의 공통 컬럼은 ID이다. 그런데 각 데이터 프레임의 ID컬럼의 데이터 순서가 서로 다르다. 그래도 merge() 메서드를 써서 병합하면 알아서 제대로 된다.

pd.merge(student_card1, student_card2, on='ID')

 

보다시피 제 값을 찾아서 잘 병합이 된 것을 알 수 있다.

그럼 빠잉~!