728x90
Python 첫 게시글을 무엇으로 할까, 고민하다가 제가 가장 유용하게 쓰는 코드로 첫 글을 시작합니다.
이따금 많은 양의 데이터를 다루면서 변수가 많을 때, 그리고 파생변수를 만들어서 컬럼들을 한 번에 파악하기 힘들 때 사용하기 편리합니다.
먼저 titanic 데이터를 불러와 줍니다.
import pandas as pd
df = pd.read_csv('train.csv')
df.head()

타이타닉의 컬럼들을 확인할 때는 아래와 같이 작성합니다.
df.columns

이렇게 결과가 나옵니다.
하지만 전체 컬럼 결과만 나옵니다.
특정 컬럼명만 확인하고 싶다면 아래와 같이 작성합니다.
class가 포함된 컬럼명을 찾겠습니다.
df.columns[df.columns.str.contains('class')]

만약 컬럼명이 아래와 같다면,

이 중 passenger와 관련된 컬럼명을 뽑고 싶을 때 필터링 할 수 있습니다.
df.columns[df.columns.str.contains('passenger')]

컬럼명은 보통, 비율을 구하는 ratio컬럼이나 특정 데이터의 컬럼명을 확인하고 싶을 때 사용하기 편리합니다.
728x90
'Code > Python' 카테고리의 다른 글
[Python]list type 변경 (0) | 2022.11.03 |
---|---|
[Python] list 합집합, 교집합, 차집합, 대칭차집합 (0) | 2022.11.03 |
[Python]DataFrame 정렬, sort_values() / sort_index(), 다중 정렬 (0) | 2022.11.02 |
[Python]numpy 배열 저장 및 불러오기, Value Error 수정 (0) | 2022.11.01 |
[Python]중복값 확인(데이터가 동일한 row, column 찾기) (0) | 2022.10.31 |