Code/Python
[Python]중복값 확인(데이터가 동일한 row, column 찾기)
heedy
2022. 10. 31. 15:48
728x90
- 동일한 row 찾기
row 같은 경우에는 아래 코드를 사용하여 중복된 row를 확인할 수 있습니다.
df[df.duplicated()]
*option으로 keep = ['first', 'last', 'False']를 설정할 수 있습니다.
- first: 중복된 row 중 첫번째 row를 남깁니다.
- last: 중복된 row 중 마지막 row를 남깁니다.
- False: 중복된 row 전체를 남깁니다.
- 동일한 column 찾기
하지만 동일한 데이터 값을 가진 컬럼을 찾는 것은 별도로 함수가 없기때문에
전치를 해준 후 DataFrame.duplicated() 통해 찾을 수 있습니다.
import pandas as pd
import numpy as np
# 전치는 .T 또는 np.transpose()를 사용하면 됩니다.
df = df.T
# df = np.transpose(df)
df[df.duplicated()]
중복된 컬럼을 찾은 후 다시 전치하여 원래 형태로 복원하여 데이터 프레임을 사용하면 됩니다.
728x90