Code/Python

[Python]특정 문자열이 포함된 column 필터링

heedy 2022. 10. 31. 15:22
728x90

Python 첫 게시글을 무엇으로 할까, 고민하다가 제가 가장 유용하게 쓰는 코드로 첫 글을 시작합니다.

이따금 많은 양의 데이터를 다루면서 변수가 많을 때, 그리고 파생변수를 만들어서 컬럼들을 한 번에 파악하기 힘들 때 사용하기 편리합니다.

먼저 titanic 데이터를 불러와 줍니다.

import pandas as pd

df = pd.read_csv('train.csv')
df.head()

타이타닉의 컬럼들을 확인할 때는 아래와 같이 작성합니다.

df.columns

이렇게 결과가 나옵니다.
하지만 전체 컬럼 결과만 나옵니다.
특정 컬럼명만 확인하고 싶다면 아래와 같이 작성합니다.

class가 포함된 컬럼명을 찾겠습니다.

df.columns[df.columns.str.contains('class')]

filtering된 컬럼명 찾기

 만약 컬럼명이 아래와 같다면,

 

이 중 passenger와 관련된 컬럼명을 뽑고 싶을 때 필터링 할 수 있습니다.

df.columns[df.columns.str.contains('passenger')]

 

컬럼명은 보통, 비율을 구하는 ratio컬럼이나 특정 데이터의 컬럼명을 확인하고 싶을 때 사용하기 편리합니다.

728x90