ํ์ต ๋ฐ์ดํฐ ์ค ๋ชจ๋ ๋ณ์๋ฅผ ์ฌ์ฉํ๋ฉด ๋ ธ์ด์ฆ ๋ฐ์ดํฐ๊ฐ ์์ฌ์ ๋ชจ๋ธ ์ฑ๋ฅ์ด ์ ๋์ค์ง ์์ ์ ์์ต๋๋ค. ๋ชจ๋ธ ์ฑ๋ฅ์ ๋์ด๊ธฐ ์ํด ๋ณ์๋ฅผ ์ ํํ๋ ๊ณผ์ ์ ๊ฑฐ์ณ์ผ ํ๋๋ฐ, ๋ณ์ ์ค์๋๋ฅผ ํ์ฉํ์ฌ ์ ํํ๋ ๋ฐฉ๋ฒ์ด ์์ต๋๋ค. RandomForest๋ฅผ ์ด์ฉํ์ฌ titanic๋ฐ์ดํฐ๋ฅผ ํ์ตํ ํ ๋ณ์ ์ค์๋๋ฅผ ์ถ๋ ฅํ๊ฒ ์ต๋๋ค. ๋จผ์ , titanic ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์์ค๋๋ค. import pandas as pd df = pd.read_csv('train.csv') df.head() RandomForest๋ฅผ ์ด์ฉํ์ฌ ํ์ต์ ์งํํฉ๋๋ค. ํ์ต์ ์ํด object column์ ์ฌ์ฉํ์ง ์์ต๋๋ค. Nan ๊ฐ์ ํ๊ท ๊ฐ์ผ๋ก ์ฒ๋ฆฌํด์ค๋๋ค. # object column ์ ์ธ df = df.select_dtypes(exclude= 'ob..