본문 바로가기

Python/Data Visualization26

[시각화] 크롤링 결과 워드클라우드 시각화 빅데이터 콘테스트의 수상작 제목을 워드클라우드로 시각화해보자. 결과는 다음과 같다. 라이브러리와 데이터 불러오기 import pandas as pd from wordcloud import WordCloud import matplotlib.pyplot as plt df = pd.read_csv('BigdataContest.csv') df.head() 한글 폰트 설정 from matplotlib import font_manager, rc # 한글 폰트 설정 font_path = "../NanumGothic.ttf" # "NanumGothic.ttf" 파일이 있는 경로로 수정 font_name = font_manager.FontProperties(fname=font_path).get_name() rc('fon.. 2023. 10. 4.
[시각화] 한글 폰트 코드 정리 matplotlib이나 seaborn으로 그래프를 그릴 때 한글이 깨져서 나오거나 워드클라우드로 한글이 안나올때가 있다. 시도할 수 있는 코드를 정리해 보았다. 코드 1 이 코드의 핵심은 font_path에 폰트 파일을 넣고, 그 경로를 명확히 써야하는 것이다. 나머지는 똑같이 복붙하면 된다. from matplotlib import font_manager, rc # 한글 폰트 설정 font_path = "../NanumGothic.ttf" # "NanumGothic.ttf" 파일이 있는 경로로 수정 font_name = font_manager.FontProperties(fname=font_path).get_name() rc('font', family=font_name) 코드 2 이 코드는 설치된 폰트 .. 2023. 10. 4.
여러 개의 그래프 그리기 예제(반복문 사용) 1. 여러 개의 그래프 그리기 - 시각화 할 변수 선택 - fig 만들기 fig=plt.figure(figsize=(20,10), dpi = 100) : matplotlib의 figure를 생성하고, 그림의 크기를 가로 20 인치, 세로 10 인치로 설정하며, 해상도는 100 dpi로 설정합니다. axs=fig.subplots(2,4) : 2x4 형태의 서브플롯 그리드를 생성합니다. 즉, 2행 4열의 그리드를 생성하여 총 8개의 그래프를 그릴 수 있는 공간을 만듭니다. lm_features 변수에 각 그래프에 사용할 특징들을 리스트로 정의합니다. fig=plt.figure(figsize=(20,10), dpi = 100) axs=fig.subplots(2,4) lm_features = ['temperat.. 2023. 9. 7.
[scatter_matrix] 여러 피쳐간 산점도 한번에 보기 라이브러리 임포트 from pandas.plotting import scatter_matrix import matplotlib.pyplot as plt %matplotlib inline 산점도 그리기(여러 피쳐를 한번에) attributes = ['주간통화시간', '주간통화요금', '주간통화횟수'] # 산점도 한번에 그리기 scatter_matrix(train[attributes], figsize = (10, 10), alpha = 0.1) 결과 예시 2023. 8. 31.
시각화 준비용 코드 (한글폰트 설정 & 경고 무시) import warnings # 1 warnings.simplefilter(action='ignore', category=FutureWarning) import matplotlib.pyplot as plt # 2 import matplotlib.font_manager as fm # 3 fe = fm.FontEntry(fname = 'NotoSansKR-Regular.otf', name = 'NotoSansKR') # 4 fm.fontManager.ttflist.insert(0, fe) # 5 plt.rc('font', family='NotoSansKR') # 6 warnings 모듈(module)을 임포트(import)하고, 경고 메시지를 무시하기 위한 필터를 설정 FutureWarning이라는 특정 경.. 2023. 8. 30.
랜덤 포레스트 모델 검증 시각화 ▶︎ 랜덤 포레스트 모델의 실제값(y_valid)과 예측값(predict)의 차이 를 그래프로 시각화 ▶︎ 시각화 코드 평가지표 함수 만들기 : RMSE from sklearn.metrics import mean_squared_error def rmse(real, pred): return mean_squared_error(real, pred)**0.5 RMSE = rmse(y_valid, predict) RMSE 시각화 라이브러리 임포트 한글폰트 설정 RMSE : 앞의 함수에서 만든 RMSE 불러오기 그래프 그리기 # 시각화를 위한 라이브러리 import matplotlib.pyplot as plt import matplotlib.font_manager as fm # 한글 폰트를 사용하기 위한 코드 fe.. 2023. 8. 30.
[gca() 함수] 그래프에 패치(타원, 사각형 등) 그리기 gca() 함수 그래프로 시각화하다보면, 이상치로 의심되는 부분을 표시하거나 경향성을 선이나, 사각형, 원(타원) 등으로 표시하고 싶다. 그때 사용하는 것이 gca() 함수이다 현재 활성화된 Figure에 대응하는 Axes 객체를 반환 : "gca"는 "get current axes"의 약어 예제 상황과 코드 버스 운행 거리가 1000이하이면서 운행 시간이 1000이상일 때 운행 거리에 비례하여 운행 시간이 증가하지 않는 것을 확인함 따라서 직사각형으로 이 구간을 표시함으로써 해당 구간이 이상치인지 조금 더 명확하게 확인할 예정 plt.gca().add_patch() : 현재 그래프에 새로운 패치(patch)를 추가 패치는 그래프에 도형을 그리는 데 사용됨 patches.Rectangle()은 사각형 패.. 2023. 8. 24.
[folium 라이브러리] 위도 경도 정보를 활용한 지도 그리기 folium 포리움(folium) 라이브러리는 leaflet.js(자바스크립트 라이브러리) 기반으로 만들어진 Python 지도 시각화 라이브러리이다 포리움 라이브러리의 Map() 함수를 이용하면 간단하게 지도 객체를 만들 수 있다 함수 구성 location : 지도의 중심 [위도, 경도] 좌표 zoom_start : 처음 지도의 확대 비율 조절 (최대 18) width, height : 너비, 높이 # 기본 좌표 설정 m = folium.Map(location=[위도, 경도], zoom_start=17, width=750, height=500) 지도 위, 동그라미 표시 location: 동그라미를 표시할 위도/경도 좌표 radius : 동그라미 크기 tooltip: 표기할 툴팁 지정 (마우스 오버 시 표.. 2023. 8. 24.
[연속형 변수 단일값 시각화] Univariate analysis of continuous variables kaggle study ▶︎ 결과 ▶︎ 시각화 코드 1. 라이브러리 임포트 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import plotly.express as px import matplotlib from wordcloud import WordCloud import warnings warnings.filterwarnings("ignore", category=FutureWarning) 2. 데이터 로드 df = pd.read_csv('healthcare-dataset-stroke-data.csv') tabular = pd.read_csv('tabular-playground-seri.. 2023. 8. 22.
728x90