반응형

Python 3

배열 값에 존재하는 column 필터하기: pandas

안녕하세요. pandas.DataFrame을 사용할 때 꼭 필요한 기능 중 하나가 `필터`라고 생각하는데요. 필터의 역할을 하는 작업 중 pd.DataFrame.isin() 사용 방법에 대한 글입니다. 데이터는 SK HUB의 오픈 데이터 중 통화 데이터입니다. 문법 filter_list = ['2020-01-01','2019-10-01'] # 추출하고 싶은 컬럼 filtering = t_df['일자'].isin(filter_list) # filtering 생성 True or False t_df[filtering] # target DataFrame에서 추출하기 데이터 생성 # sample data columns = ['일자(YYYYMMDD)', '연령', '성별', '발신지', '대분류', '중분류', '..

Python 2021.01.04

seaborn x의 정렬이 안될 때 - YYYYMMDD의 dtype

안녕하세요. pandas에서 정렬해서 seaborn에 입력했는데 `정렬이 잘못 적용되고 있다` 이번 글은 python pandas의 int64 타입과 seaborn.barplot과 관련된 글입니다. 데이터 타입(Dtype)을 인지하자 언급되는 기술 pandas seaborn.barplot 데이터엔 무엇이 있는지 EDA를 진행하던 중에 겪은 내용입니다. 결론은 원시 데이터를 전처리 후 저장하고, 저장한 데이터를 다시 호출하는 과정에서 발생하는 형변환입니다. 처음 데이터를 가공했을 때 object 타입이었으나, 저장과 호출을 반복하는 과정에서 int64타입으로 바뀌는 현상 숫자 형태의 값만 있을 경우 csv 파일로 저장 및 불러오기에서 int로 변환된다. seaborn에서 정렬 barplot 함수를 사용할 ..

Python/시각화 2021.01.03

csv 파일 공개 저장소에서 불러오기 on colab

안녕하세요. github 계정 생성과 raw 데이터를 공개 저장소인 github에 올리고 호출하는 과정이 막막하다는 내용을 보고 글을 작성하게 되었습니다. 글을 읽으시는 분에게 조금이나마 도움이 되길 바랍니다. 비개발직에 계신 분들이 많은 것 같아 아래의 행동 화면을 담게 되었습니다. csv 파일 다운로드 (기상청) github 계정 생성 repository 생성 파일 업로드 colab에서 호출하기 csv 파일 다운로드 해당 데이터는 공공데이터인 기상청 데이터를 기준으로 진행합니다. 1. 다운로드 https://data.kma.go.kr/stcs/grnd/grndRnDay.do?pgmNo=156 저는 위 주소에서 csv 파일을 받았지만, 실제 활용하시는 데이터를 내려받으시면 되겠습니다. 2. github..

Python/colab 2020.10.31
반응형