↓폴밍끼 유튜브 채널 자세히보기

데이터프레임 13

판다스 pandas 데이터 프레임 dataframe 결측치 있는 행 찾기

subway_df['도로명주소'] subway_df라는 데이터프레임이 있는데 거기서 '도로명주소' 컬럼의 데이터만 가져온 모습 입니다. 이 컬럼에는 결측치가 하나 있습니다. 그 결측치인 행을 찾고 싶습니다. # 결측치인 행의 인덱스 반환 subway_df['도로명주소'][subway_df['도로명주소'].isnull()] 위 코드로 boolean 인덱싱을 하면 손쉽게 결측치 행의 인덱스를 찾을 수 있습니다. 165 행이었네요. subway_df.loc[165] 결측치인 165행을 인덱싱한 모습입니다. 도로명 주소가 결측치라고 뜨는 것이 보입니다. 그럼 모두 즐판다스 하세요~!

판다스 pandas 데이터 프레임 dataframe 을 csv 파일로 내보내기, 저장하기

아래와 같이 완성된 데이터 프레임이 있는데요, 이 데이터 프레임을 csv파일로 저장해서 두고두고 쓰려면 # 데이터 프레임으로 내보내기 gu_seoul_df.to_csv('data/서울시 구별 데이터.csv', index=False) 이렇게 to_csv() 코드를 사용하면 됩니다. 저는 index=False로 설정해주었는데요, index인자를 기본값(True)로 저장하면 추가로 인덱스를 생성하고 원래 인덱스는 컬럼으로 보내버리기 때문에 아래와 같이 저장됩니다. 그래서 현재 데이터 프레임을 그대~로 저장하고 싶다면 index=False인자를 넣어주세요.

같지만 데이터의 순서가 다른 공통 컬럼을 가진 판다스 데이터 프레임(dataframe) 병합이(merge) 가능한가?

일단 결론부터 말하면, 알아서 잘 병합된다. (그런데 데이터가 일부는 같고 일부는 서로 다르다면 서로 다른 부분은 제외하고 공통인 부분만 병합이 됨. 그래서 행 수가 그만큼 줄어듦.) 예를 들어 보자. student_card1 = pd.DataFrame({'ID':[20190103, 20190222, 20190531], 'name':['Kim', 'Lee', 'Jeong'], 'class':['H', 'W', 'S']}) student_card1 student_card2 = pd.DataFrame({'ID':[20190222, 20190531, 20190103], 'age':[20, 21, 22]}) student_card2 student_card1과 student_card2의 공통 컬럼은 ID이다. 그..