728x90
- 동일한 row 찾기
row 같은 경우에는 아래 코드를 사용하여 중복된 row를 확인할 수 있습니다.
df[df.duplicated()]
*option으로 keep = ['first', 'last', 'False']를 설정할 수 있습니다.
- first: 중복된 row 중 첫번째 row를 남깁니다.
- last: 중복된 row 중 마지막 row를 남깁니다.
- False: 중복된 row 전체를 남깁니다.
- 동일한 column 찾기
하지만 동일한 데이터 값을 가진 컬럼을 찾는 것은 별도로 함수가 없기때문에
전치를 해준 후 DataFrame.duplicated() 통해 찾을 수 있습니다.
import pandas as pd
import numpy as np
# 전치는 .T 또는 np.transpose()를 사용하면 됩니다.
df = df.T
# df = np.transpose(df)
df[df.duplicated()]
중복된 컬럼을 찾은 후 다시 전치하여 원래 형태로 복원하여 데이터 프레임을 사용하면 됩니다.
728x90
'Code > Python' 카테고리의 다른 글
[Python]list type 변경 (0) | 2022.11.03 |
---|---|
[Python] list 합집합, 교집합, 차집합, 대칭차집합 (0) | 2022.11.03 |
[Python]DataFrame 정렬, sort_values() / sort_index(), 다중 정렬 (0) | 2022.11.02 |
[Python]numpy 배열 저장 및 불러오기, Value Error 수정 (0) | 2022.11.01 |
[Python]특정 문자열이 포함된 column 필터링 (0) | 2022.10.31 |