분류 전체보기 6

[공부자료] Geopandas 라이브러리 처음 써보기

시험기간에...미쳐서..새벽에 공부하다 갑자기 블로그 쓰기 1일차. 오늘은 Geopandas 라이브러리에 대해 최대한 간단히 정리해 두려고 합니다. 지도 데이터 혹은 위치/공간 데이터를 다룰 때 자주 소개되는 라이브러리로는 Geopandas랑 Folium 정도가 있습니다. (적어도 제가 들어본 건 그정도임..) 이전에 Folium 라이브러리는 다룬 적이 있었는데 Geopandas도 비슷한 느낌일 줄 알았는데, 훨씬 더 복잡하더라고요... 몇 시간째 붙들고 있었는데 여기다가 간단히 알게 된 내용 정리해 두겠습니다. 최대한 이해하기 쉽게 적어 봤습니다. 왜냐하면 제가 모르면 다시 와서 봐야 되니까요. 공모전을 준비하는 중인데 지도 관련 데이터를 시각화할 일이 생겨서, 잠깐 공부한 내용을 정리해 봤습니다.중간..

공부 자료 2025.04.19

[데이터분석] 출퇴근 시간 지하철역 혼잡도 시각화

안녕하세요. 종강 및 퇴사 이슈로 할일이 없어진 사람입니다. 심심해서 혼자서 데이터분석 프로젝트를 진행해 보았어요.이세상에 태어나고 두번째로 진행해본 프로젝트입니다.(첫번째껀 나중에 올리게씀) 제가 다 한 건 아니고 관련 코드 참고하여, 조금 더 발전시키고 다양하게 시각화하는 쪽으로 이것저것 해보았습니다.(이사람 애초에 혼자 힘으로 진행한 프로젝트가 없어요..) 원래는 git로 블로그 페이지 만들고 거기다가 올리려고 했는데, git 익히는 데 오래 걸릴 것 같아서 일단 네이버 블로그로 올리기로 했습니다. velog나 Notion으로 정리하는 것도 고민했었는데, velog는 광고로 인한 가독성 이슈로, Notion은 용량 많아지면 버벅이는 이슈로 탈락해버림.. 그냥 하루빨리 git 을 익히도록 하는걸로 발..

데이터분석 2025.04.05

[MATRIX] 파이썬에서 csv 파일 불러오기

데이터분석을 위한 가장 첫 단계는 데이터(이하 데이터셋)를 불러오는 것입니다. 학부생 수준에서의 데이터 분석을 위한 데이터셋은 대부분 Excel 혹은 csv파일입니다. Excel 파일의 확장자는 .xlsx이고 csv 파일의 확장자는 .csv입니다. 기억해두면 좋습니다.  이번 글에서는 다음과 같은 분들을 대상으로 파이썬에서 csv 파일 불러오는 법에 대해 최대한 자세히 설명하도록 하겠습니다.  1. 파이썬을 처음 사용해보시는 분2. 파이썬에서 판다스 라이브러리를 사용해 본 적이 없으신 분3. 추가로 Kaggle을 사용해 본적이 없으신 분은 목차의 0번까지만 읽어주시면 좋습니다.  1번과 2번에 해당하지 않는다면, 이 글을 읽으실 필요 없습니다. 어서 뒤로가기 버튼을 누르세요. 목차0. Kaggle에서 c..

공부 자료 2025.03.26

[ML/DL] Titanic 데이터셋 (3): 예측 모델 구축

지난글: https://powderblue0.tistory.com/2 [데이터분석] Titanic 데이터셋: 시각화 & 피쳐 엔지니어링지난글: https://powderblue0.tistory.com/1 [데이터분석] Titanic 데이터셋: 결측치 처리안녕하세요. 티스토리 블로그로 다시 돌아왔습니다.아무래도 네이버 블로그보다는 티스토리로 갈아타는게 좋아 보powderblue0.tistory.com이전의 두 글을 통해 Titanic 데이터셋에 대해 전처리와 피쳐 엔지니어링 등등을 시도해 보았습니다. 이번 글에서는 Kaggle 대회라는 본래 목적의 달성을 위해 예측 모델을 만드는 과정을 다루겠습니다. 사실 본래 목적이 Kaggle 대회에 한 번 나가보는 것이었다고는 하나, 막상 진행하면서는 전처리 과정에 ..

[데이터분석] Titanic 데이터셋 (2): 시각화 & 피쳐 엔지니어링

지난글: https://powderblue0.tistory.com/1 [데이터분석] Titanic 데이터셋: 결측치 처리안녕하세요. 티스토리 블로그로 다시 돌아왔습니다.아무래도 네이버 블로그보다는 티스토리로 갈아타는게 좋아 보였어욯ㅎㅎ 근황토크)) 몇주간 통계학이랑 Adsp 공부를 하느라 바빠서(사실 공powderblue0.tistory.com지난 글에서의 Titanic 데이터셋의 결측치 처리에 이어 전처리 과정을 조금 더 진행해 보도록 하겠습니다. 결측치 처리를 하였으니 (이상치 탐색은 Pass하고), 이번 글에서는 모델 훈련에 앞서 Feature Engineering을 진행해 보도록 합니다. 참고한 코드 링크 올려두겠습니다!! https://www.kaggle.com/code/gunesevitan/t..

데이터분석 2025.02.25

[데이터분석] Titanic 데이터셋 (1): 결측치 처리

안녕하세요. 티스토리 블로그로 다시 돌아왔습니다.아무래도 네이버 블로그보다는 티스토리로 갈아타는게 좋아 보였어욯ㅎㅎ 근황토크)) 몇주간 통계학이랑 Adsp 공부를 하느라 바빠서(사실 공부 안함 히히) 데이터분석이나 머신러닝 쪽 공부를 많이 못했어요.Adsp 데이터분석 준전문가 44회 시험을 보고 왔습니다..! 풀고나서 보니 다들 어려웠다고 하더라고요. 왠지 한번에 풀리는 문제가 많이 없더라ㅋㅋㅋㅋ뭐 이번에 떨어지면 그냥 5만원 날리고 공부나 열심히 한 셈 치겠습니다. 근데 자격증 시험이 대체 뭐길래...저에게서 5만원이나 뜯어가는 걸까요. 준전문가니 뭐니 있어보이는 말들이지만 50문제중에 30문제 맞추면 자격증 주는 그런 어렵진 않은 자격증 시험이라..뭔가 막상 떨어지면 운전면허 필기 떨어진 것마냥 그런..

데이터분석 2025.02.24