728x90

Code/Python 12

[Python]중복값 확인(데이터가 동일한 row, column 찾기)

- 동일한 row 찾기 row 같은 경우에는 아래 코드를 사용하여 중복된 row를 확인할 수 있습니다. df[df.duplicated()] *option으로 keep = ['first', 'last', 'False']를 설정할 수 있습니다. first: 중복된 row 중 첫번째 row를 남깁니다. last: 중복된 row 중 마지막 row를 남깁니다. False: 중복된 row 전체를 남깁니다. - 동일한 column 찾기 하지만 동일한 데이터 값을 가진 컬럼을 찾는 것은 별도로 함수가 없기때문에 전치를 해준 후 DataFrame.duplicated() 통해 찾을 수 있습니다. import pandas as pd import numpy as np # 전치는 .T 또는 np.transpose()를 사용하면..

Code/Python 2022.10.31

[Python]특정 문자열이 포함된 column 필터링

Python 첫 게시글을 무엇으로 할까, 고민하다가 제가 가장 유용하게 쓰는 코드로 첫 글을 시작합니다. 이따금 많은 양의 데이터를 다루면서 변수가 많을 때, 그리고 파생변수를 만들어서 컬럼들을 한 번에 파악하기 힘들 때 사용하기 편리합니다. 먼저 titanic 데이터를 불러와 줍니다. import pandas as pd df = pd.read_csv('train.csv') df.head() 타이타닉의 컬럼들을 확인할 때는 아래와 같이 작성합니다. df.columns 이렇게 결과가 나옵니다. 하지만 전체 컬럼 결과만 나옵니다. 특정 컬럼명만 확인하고 싶다면 아래와 같이 작성합니다. class가 포함된 컬럼명을 찾겠습니다. df.columns[df.columns.str.contains('class')] 만..

Code/Python 2022.10.31
728x90