[Python]중복값 확인(데이터가 동일한 row, column 찾기)

Code/Python

heedy 2022. 10. 31. 15:48

728x90

row 같은 경우에는 아래 코드를 사용하여 중복된 row를 확인할 수 있습니다.

df[df.duplicated()]

*option으로 keep = ['first', 'last', 'False']를 설정할 수 있습니다.

하지만 동일한 데이터 값을 가진 컬럼을 찾는 것은 별도로 함수가 없기때문에
전치를 해준 후 DataFrame.duplicated() 통해 찾을 수 있습니다.

import pandas as pd
import numpy as np

# 전치는 .T 또는 np.transpose()를 사용하면 됩니다.
df = df.T
# df = np.transpose(df)

df[df.duplicated()]

중복된 컬럼을 찾은 후 다시 전치하여 원래 형태로 복원하여 데이터 프레임을 사용하면 됩니다.

728x90

[Python]list type 변경 (0)	2022.11.03
[Python] list 합집합, 교집합, 차집합, 대칭차집합 (0)	2022.11.03
[Python]DataFrame 정렬, sort_values() / sort_index(), 다중 정렬 (0)	2022.11.02
[Python]numpy 배열 저장 및 불러오기, Value Error 수정 (0)	2022.11.01
[Python]특정 문자열이 포함된 column 필터링 (0)	2022.10.31

250x250

🎈언제나 열심히 사는 heedy의 기록🎈

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

Im heedy