본문 바로가기
반응형

프로그래밍/데이터분석4

데이터분석, 파이썬 판다스 데이터프레임 다양한 합치기 방법 (행, 열, merge, for, concat) 안녕하세요 K-인사이트입니다. 데이터를 분석하기 위해 여러 데이터를 다양한 방법으로 합치는 기술은 매우 필수적입니다. 분석의 과정은 오래걸리지 않으나 이를 합치고 자르고 다시 이어붙이는 과정에는 상당한 시간과 데이터에 대한 이해가 필요합니다. 프로그래밍 분야에서 SQL 영역에 속합니다. 예를들어 여러개 파일로 분할된 CSV 파일을 하나의 데이터프레임으로 만들 수 있습니다. 그리고 서로 다른 두 데이터프레임을 열을 기준으로 결합 할 수도 있습니다. 이 글에서는 기본적이지만 가장 중요한 데이터를 결합하는 다양한 방법에 대해서 알아보도록 하겠습니다. 파이썬 환경 구축 pipenv 를 통해서 간편하게 원하는 파이썬 환경을 구성할 수 있습니다. 관련된 내용은 아래의 링크를 참고해주세요. https://k-in.t.. 2024. 4. 23.
데이터분석, 파이썬 CSV 파일 불러오기, 경로 오류 처리, 한글깨짐(utf-8) 보정 (feat. numpy, pandas) 안녕하세요 K-인사이트입니다. 데이터 분석에서 가장 중요한 절차 중 데이터를 입력하고 이를 적절히 처리하는 과정입니다. 데이터 저장 및 유통에 가장 많이 사용되는 포맷은 csv(comma-separated values) 파일 포맷입니다. 간소한 포맷과 엑셀 등의 프로그램에서 읽어오기 용이한 형태입니다. 이 파일을 읽어오면서 데이터 분석의 관문이 열리게됩니다. 하지만 csv 파일을 불러올 때 데이터 분석을 어렵게 하는 요인들이 있습니다. 예를 들어, 불러오기 경로 오류, 한글 깨짐 오류 등이 있습니다. 이 글에서는 파일 불러오기와 관련된 다양한 유형들을 다루어 보도록 하겠습니다. 파이썬 환경 구축 pipenv 를 통해서 간편하게 원하는 파이썬 환경을 구성할 수 있습니다. 관련된 내용은 아래의 링크를 참고해.. 2024. 4. 22.
Jupyter Notebook, No Attribute 에러 해결을 위한 모듈 리로드(reload) 방법 안녕하세요 K-인사이트입니다. Jupyter Notebook과 같은 대화형 개발 도구를 이용해 데이터를 분석하다보면 반복해서 사용하는 함수 등을 별도의 python 소스코드로 저장해서 개발하는 경우가 있습니다. 예를 들어, 그래프를 그리거나 텍스트 날짜 정보를 변환하거나 등이 있습니다. 그런데, import 구문들이 위치하는 셀(Cell)을 재실행해도 새롭게 추가한 함수를 찾을 수 없다는 AttributeError: module ‘xxx’ has no attribute ‘yy’ 에러를 만나는 경우가 있습니다. 2024. 4. 1.
데이터분석, TLT 와 미국 기준금리(Fedfunds)를 그래프로 그리기 안녕하세요 K-인사이트 입니다. 24.03.26 가독성 향상을 위한 게시글 업데이트를 하였습니다. 구독자 분들 참고드립니다. 미국 장기채(TLT, TMF)에 대한 추가매수를 고려하던 중에 미국기준금리와 TLT 주가를 하나의 차트로 보여주기위한 작업을 하였습니다. M2(M2SL) 발행량에 따른 나스닥지수 그래프를 한눈에 보이도록하는 작업을 진행하였고 그 결과물을 공유드립니다. 2024. 2. 4.
반응형