728x90

์ค‘๋ณต์—ด 1

[Python]์ค‘๋ณต๊ฐ’ ํ™•์ธ(๋ฐ์ดํ„ฐ๊ฐ€ ๋™์ผํ•œ row, column ์ฐพ๊ธฐ)

- ๋™์ผํ•œ row ์ฐพ๊ธฐ row ๊ฐ™์€ ๊ฒฝ์šฐ์—๋Š” ์•„๋ž˜ ์ฝ”๋“œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ค‘๋ณต๋œ row๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. df[df.duplicated()] *option์œผ๋กœ keep = ['first', 'last', 'False']๋ฅผ ์„ค์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. first: ์ค‘๋ณต๋œ row ์ค‘ ์ฒซ๋ฒˆ์งธ row๋ฅผ ๋‚จ๊น๋‹ˆ๋‹ค. last: ์ค‘๋ณต๋œ row ์ค‘ ๋งˆ์ง€๋ง‰ row๋ฅผ ๋‚จ๊น๋‹ˆ๋‹ค. False: ์ค‘๋ณต๋œ row ์ „์ฒด๋ฅผ ๋‚จ๊น๋‹ˆ๋‹ค. - ๋™์ผํ•œ column ์ฐพ๊ธฐ ํ•˜์ง€๋งŒ ๋™์ผํ•œ ๋ฐ์ดํ„ฐ ๊ฐ’์„ ๊ฐ€์ง„ ์ปฌ๋Ÿผ์„ ์ฐพ๋Š” ๊ฒƒ์€ ๋ณ„๋„๋กœ ํ•จ์ˆ˜๊ฐ€ ์—†๊ธฐ๋•Œ๋ฌธ์— ์ „์น˜๋ฅผ ํ•ด์ค€ ํ›„ DataFrame.duplicated() ํ†ตํ•ด ์ฐพ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. import pandas as pd import numpy as np # ์ „์น˜๋Š” .T ๋˜๋Š” np.transpose()๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด..

Code/Python 2022.10.31
728x90