본문 바로가기

Python/Data Visualization26

[구글 colab 데이터 시각화] 한글 폰트 설정 1. 폰트 설치 코드 작성 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf 2. 런타임 재실행 후, 다음 코드를 실행하여 테스트 import matplotlib.pyplot as plt plt.rc("font", family="NanumGothic") # 라이브러리 불러오기와 함께 한번만 실행 plt.plot([1, 2, 3]) plt.title("한글") plt.show() 3. 아래와 같이 테스트 코드 결과가 나오면 데이터 시각화에도 한글이 잘 나타난다 4. 데이터 시각화 2023. 8. 16.
[Kaggle 데이터 활용] 연도별 프로그래밍 언어의 사용성 추이 파악 프로그래밍 언어 데이터 추출하여, 연도별 사용도 파악 2019년부터 2020년까지의 Kaggle Survey 데이터 활용 1. 데이터 불러오기 df_2021 = pd.read_csv("./data/kaggle/kaggle_survey_2021/kaggle_survey_2021_responses.csv") df_2020 = pd.read_csv("./data/kaggle/kaggle_survey_2020/kaggle_survey_2020_responses.csv") df_2019 = pd.read_csv("./data/kaggle/kaggle-survey-2019/multiple_choice_responses.csv") df_2021.shape, df_2020.shape, df_2019.shape 2. 각.. 2023. 8. 10.
[Kaggle 데이터 활용] 여러 개의 그래프 한번에 그리기(2) 심화 Kaggle 2021년 survey 데이터 시각화 4개 국가 별, 가장 많이 쓰이는 클라우드 서비스 시각화하여 비교하기 라이브러리 import import plotly.graph_objects as go import plotly.figure_factory as ff#대화형 시각화 라이브러리 데이터 불러오고, 간단히 가공하기 df21 = pd.read_csv("./data/kaggle/kaggle_survey_2021/kaggle_survey_2021_responses.csv") questions = df21.iloc[0, :].T df21 = df21.iloc[1:, :] 간단히 데이터 확인 print(questions['Q28']) print(questions['Q29_A_Part_1']) Of the.. 2023. 8. 10.
[Kaggle 데이터 활용] 여러 개의 그래프 한번에 그리기(2) 기초 여러 개의 그래프 한번에 그리기 plotly.subplots 를 사용하여 다음과 같이 2개 이상의 그래프를 한번에 그릴 수 있다 from plotly.subplots import make_subplots import plotly.graph_objects as go x1 = [1, 2, 3] x2 = [4, 5, 6] y1 = [10, 20, 30] y2 = [50, 60, 70] fig = make_subplots(rows = 1, cols = 2 , subplot_titles=("Plot 1", "Plot 2") , column_widths = [0.7, 0.3]) #size control fig.add_trace( go.Scatter(x = x1, y = y1) ,row = 1, col = 1 ) f.. 2023. 8. 10.
[Plotly] Kaggle Survey Data 시각화 기초 Kaggle Survey Data 시각화 0. 데이터 가져오기 import pandas as pd df = pd.read_csv('./data/kaggle/kaggle_survey_2021/kaggle_survey_2021_responses.csv') df.head() 1. 원하는 데이터 추출 #질문데이터 한 줄만 따로 뽑기 questions = df.iloc[0, :].T #나머지 데이터(인덱스 1번 이후)정리 df = df.iloc[1:, :].reset_index(drop=True) #1번 설문문항의 답을 따로 시리즈로 뽑아내기 q1_df = df['Q1'].value_counts() #1번 질문이 뭐였는지 간단히 확인 questions.Q1 >>'What is your age (# years)?'.. 2023. 8. 10.
[Kaggle 활용] 인도/미국 연봉 비율 비교 EDA 총정리 예제 데이터 분석 과정 요약 1. 시각화 대충 그려보기(간단히 plotly.express 이용) 👉 특이점 발견 (인도, 미국이 높네) 2. 분석 기획 하기 👉 두 나라의 연봉을 비교해볼까? 3. 연봉 값이 너무 다양하니, 연봉을 구간으로 나눠야겠다 👉 구간 기준을 세워 4-5개 정도로 나누자 4. 구간화 코드 작성 5. 인도, 미국 각각 groupby 연산을 통해 연봉 구간별로 분포 파악 6. 각 연봉 구간 별로 비율 파악 7. 그래프를 그려 비교 (상세한 시각화는 plotly.graph_objects 사용) 1. pd.read_csv() 로 데이터 다운 import pandas as pd df = pd.read_csv('./data/kaggle/kaggle_survey_2021/kaggle_survey_2.. 2023. 8. 10.
[Plotly] 그래프 수정가능한 옵션 보기 Plotly 그래프의 다양한 수정 옵션 보는 법 그래프를 그리고 나서, 다음 명령어를 입력하면 그래프를 수정할 수 있는 다양한 옵션 값과, 그래프에 대한 상세 구조를 볼 수 있다 특히 data나 Layout의 하위항목을 확인하며 섬세하게 그래프를 수정가능하다. fig = go.Figure() fig.show('json') 2023. 8. 10.
[Plotly] 시작하기 : 막대그래프 예제 Plotly 시작하기 plotly 라이브러리를 사용하는 방법을 간단히 두 가지로 나눌 수 있다. 간단하게 그리고 싶을 때와, 디테일하게 옵션값을 변경하며 그래프를 손보고 싶을 때 아래 두 방법 중 하나를 경우에 따라 택한다 처음 다루며 사용할 때는 plotly.express를 추천한다 import plotly.express as px #seaborn 라이브러리와 비슷(간단하게 빠르게 그릴 경우, 추가 옵션 없이) import plotly.graph_objects as go #matplotlib 라이브러리와 비슷(디테일하게 다룰 경우) plotly.express 예제 1. 데이터 간단하게 만들기 temp = pd.DataFrame({ "Fruit": ["Apples", "Oranges", "Bananas".. 2023. 8. 10.
[API 다루기] XML > JSON > dataframe 변환하기 👾 공공데이터 포털의 부동산 실거래가 자료를 가져와보자. requests, pandas 두 개의 라이브러리를 import 인증키와 페이지번호, 페이지당 결과수, 지역코드, 계약 월은 format 문자열로 처리하여 유동적으로 선택할 수 있게 한다. url 기본형을 문자열로 입력하고, 위의 항목들을 { } 안에 넣어 포맷팅한다. req 에 url로부터 xml 데이터 요청하고, req.text로 이를 확인한다. import requests import pandas as pd serviceKey = "인증키" pageNo = 1 # 페이지 번호 numOfRows = 1000 # 한 페이지 결과수 LAWD_CD = 11560 # 지역코드 DEAL_YMD = 202307 # 계약월 url = f'http://ope.. 2023. 8. 7.
728x90