Code/Python
[Python]특정 문자열이 포함된 column 필터링
heedy
2022. 10. 31. 15:22
728x90
Python 첫 게시글을 무엇으로 할까, 고민하다가 제가 가장 유용하게 쓰는 코드로 첫 글을 시작합니다.
이따금 많은 양의 데이터를 다루면서 변수가 많을 때, 그리고 파생변수를 만들어서 컬럼들을 한 번에 파악하기 힘들 때 사용하기 편리합니다.
먼저 titanic 데이터를 불러와 줍니다.
import pandas as pd
df = pd.read_csv('train.csv')
df.head()
타이타닉의 컬럼들을 확인할 때는 아래와 같이 작성합니다.
df.columns
이렇게 결과가 나옵니다.
하지만 전체 컬럼 결과만 나옵니다.
특정 컬럼명만 확인하고 싶다면 아래와 같이 작성합니다.
class가 포함된 컬럼명을 찾겠습니다.
df.columns[df.columns.str.contains('class')]
만약 컬럼명이 아래와 같다면,
이 중 passenger와 관련된 컬럼명을 뽑고 싶을 때 필터링 할 수 있습니다.
df.columns[df.columns.str.contains('passenger')]
컬럼명은 보통, 비율을 구하는 ratio컬럼이나 특정 데이터의 컬럼명을 확인하고 싶을 때 사용하기 편리합니다.
728x90