728x90

machin_learning 1

[Machine Learning]๋ณ€์ˆ˜ ์ค‘์š”๋„ ์ถœ๋ ฅ(feature importance)

ํ•™์Šต ๋ฐ์ดํ„ฐ ์ค‘ ๋ชจ๋“  ๋ณ€์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋…ธ์ด์ฆˆ ๋ฐ์ดํ„ฐ๊ฐ€ ์„ž์—ฌ์„œ ๋ชจ๋ธ ์„ฑ๋Šฅ์ด ์ž˜ ๋‚˜์˜ค์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ๋ณ€์ˆ˜๋ฅผ ์„ ํƒํ•˜๋Š” ๊ณผ์ •์„ ๊ฑฐ์ณ์•ผ ํ•˜๋Š”๋ฐ, ๋ณ€์ˆ˜ ์ค‘์š”๋„๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์„ ํƒํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ์Šต๋‹ˆ๋‹ค. RandomForest๋ฅผ ์ด์šฉํ•˜์—ฌ titanic๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•œ ํ›„ ๋ณ€์ˆ˜ ์ค‘์š”๋„๋ฅผ ์ถœ๋ ฅํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. ๋จผ์ €, titanic ๋ฐ์ดํ„ฐ๋ฅผ ๋ถˆ๋Ÿฌ์™€์ค๋‹ˆ๋‹ค. import pandas as pd df = pd.read_csv('train.csv') df.head() RandomForest๋ฅผ ์ด์šฉํ•˜์—ฌ ํ•™์Šต์„ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ํ•™์Šต์„ ์œ„ํ•ด object column์€ ์‚ฌ์šฉํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. Nan ๊ฐ’์€ ํ‰๊ท ๊ฐ’์œผ๋กœ ์ฒ˜๋ฆฌํ•ด์ค๋‹ˆ๋‹ค. # object column ์ œ์™ธ df = df.select_dtypes(exclude= 'ob..

Machine Learning 2022.11.01
728x90