반응형

pandas 2

배열 값에 존재하는 column 필터하기: pandas

안녕하세요. pandas.DataFrame을 사용할 때 꼭 필요한 기능 중 하나가 `필터`라고 생각하는데요. 필터의 역할을 하는 작업 중 pd.DataFrame.isin() 사용 방법에 대한 글입니다. 데이터는 SK HUB의 오픈 데이터 중 통화 데이터입니다. 문법 filter_list = ['2020-01-01','2019-10-01'] # 추출하고 싶은 컬럼 filtering = t_df['일자'].isin(filter_list) # filtering 생성 True or False t_df[filtering] # target DataFrame에서 추출하기 데이터 생성 # sample data columns = ['일자(YYYYMMDD)', '연령', '성별', '발신지', '대분류', '중분류', '..

Python 2021.01.04

seaborn x의 정렬이 안될 때 - YYYYMMDD의 dtype

안녕하세요. pandas에서 정렬해서 seaborn에 입력했는데 `정렬이 잘못 적용되고 있다` 이번 글은 python pandas의 int64 타입과 seaborn.barplot과 관련된 글입니다. 데이터 타입(Dtype)을 인지하자 언급되는 기술 pandas seaborn.barplot 데이터엔 무엇이 있는지 EDA를 진행하던 중에 겪은 내용입니다. 결론은 원시 데이터를 전처리 후 저장하고, 저장한 데이터를 다시 호출하는 과정에서 발생하는 형변환입니다. 처음 데이터를 가공했을 때 object 타입이었으나, 저장과 호출을 반복하는 과정에서 int64타입으로 바뀌는 현상 숫자 형태의 값만 있을 경우 csv 파일로 저장 및 불러오기에서 int로 변환된다. seaborn에서 정렬 barplot 함수를 사용할 ..

Python/시각화 2021.01.03
반응형