반응형
250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 윈도우함수
- 코드잇
- 결정트리
- sql연습문제
- 유학생
- 코드잇 TIL
- 코딩독학
- 파이썬
- 로지스틱회귀
- 코드잇TIL
- 나혼자코딩
- CSS
- 코딩공부
- HTML
- Seaborn
- for반복문
- 다항회귀
- 코딩
- numpy
- 머신러닝
- 선형회귀
- 영국석사
- matplotlib
- 판다스
- 행렬
- 오늘도코드잇
- SQL
- 경사하강법
- 데이터분석
- 런던
Archives
- Today
- Total
영국 척척석사 유학생 일기장👩🏻🎓
(데이터분석) seaborn으로 상자 그림(box plot) 나타내기 본문
728x90
반응형
지난 글에서 숫자 데이터와 범주형 데이터 사이의 관계를 표현할 수 있는 바이올린 플롯에 대해 알아보았습니다.
이번 글에서는 숫자 데이터와 범주형 데이터 사이의 관계를 나타내는 또 다른 방법인 상자 그림에 대해 알아보겠습니다 .
🔻(지난글)바이올린 플롯🔻
1. 상자 그림(box plot)
- 상자 그림은 평균, 중앙값, 사분위수 같은 주요 요약 통계를 간결하게 나타냅니다.
- 중앙선 : 중앙값
- 상자의 위쪽과 아래쪽 경계 : 제 3사분위수, 제 1사분위수
- 상자 바깥의 선 : 최댓값과 최솟값
- 이상치 : 별도의 점으로 나타내며 대체로 데이터의 98번째 혹은 99번째 백분위 수 바깥에 위치
2. 예시
- 먼저 필요한 라이브러리와 데이터세트를 불러옵니다.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv('../data/fuel-econ/csv')
df.head(5)
- 바이올린 플롯과 마찬가지로 상자 그림도 정량적 변수와 정성적 변수의 관계를 나타낼 때 사용됩니다.
- matplotlib과 seaborn 모두에 boxplot이라는 메서드가 있습니다.
- 여기서는 seaborn의 boxplot()함수를 사용해보겠습니다.
ax1 = sns.boxplot(data=df, x='VClass', y='comb', color='tab:blue')
plt.xticks(rotation=15);
plt.ylim(ax1.get_ylim())
- 가로 방향의 상자 그림도 나타낼 수 있습니다.
sns.boxplot(data=fuel_econ, y='VClass', x='comb', color='tab:blue')
728x90
반응형
'코딩공부 > Data analysis' 카테고리의 다른 글
(데이터분석) seaborn으로 히스토그램 faceting(면 분할) 하기 (0) | 2024.05.27 |
---|---|
(데이터분석) seaborn으로 병렬 막대 차트(Clustered bar chart), 히트맵(heatmap)그리기 (0) | 2024.05.27 |
(데이터분석) seaborn으로 Violin plot(바이올린 플롯) 나타내기 (0) | 2024.05.27 |
(데이터분석) matplotlib으로 heatmap(히트맵) 작성하기 (0) | 2024.05.27 |
(데이터분석) seaborn의 투명도, 지터링으로 산점도 과다중첩 해결하기 (0) | 2024.05.27 |