Code/Python

[Python]중복값 확인(데이터가 동일한 row, column 찾기)

heedy 2022. 10. 31. 15:48
728x90

 

- 동일한 row 찾기

row 같은 경우에는 아래 코드를 사용하여 중복된 row를 확인할 수 있습니다.

df[df.duplicated()]

*option으로 keep = ['first', 'last', 'False']를 설정할 수 있습니다.

  • first: 중복된 row 중 첫번째 row를 남깁니다.
  • last: 중복된 row 중 마지막 row를 남깁니다.
  • False: 중복된 row 전체를 남깁니다.


- 동일한 column 찾기

하지만 동일한 데이터 값을 가진 컬럼을 찾는 것은 별도로 함수가 없기때문에
전치를 해준 후 DataFrame.duplicated() 통해 찾을 수 있습니다.


import pandas as pd
import numpy as np

# 전치는 .T 또는 np.transpose()를 사용하면 됩니다.
df = df.T
# df = np.transpose(df)

df[df.duplicated()]


중복된 컬럼을 찾은 후 다시 전치하여 원래 형태로 복원하여 데이터 프레임을 사용하면 됩니다.

728x90