Coding Diary.

(데이터분석) seaborn으로 상자 그림(box plot) 나타내기 본문

Coding/Data analysis

(데이터분석) seaborn으로 상자 그림(box plot) 나타내기

life-of-nomad 2024. 5. 27. 11:37
728x90
반응형
지난 글에서 숫자 데이터와 범주형 데이터 사이의 관계를 표현할 수 있는 바이올린 플롯에 대해 알아보았습니다.
이번 글에서는 숫자 데이터와 범주형 데이터 사이의 관계를 나타내는 또 다른 방법인 상자 그림에 대해 알아보겠습니다 .

 

🔻(지난글)바이올린 플롯🔻

 

(데이터분석) seaborn으로 Violin plot(바이올린 플롯) 나타내기

🔻(지난글) 지터형 산점도🔻 (데이터분석) seaborn의 투명도, 지터링으로 산점도 과다중첩 해결하기차트에 과도하게 많은 점이 존재하거나 주어진 숫자 변수가 불연속적일 경우, 주어진 그대로

life-of-nomad.tistory.com

 

1. 상자 그림(box plot)

  • 상자 그림은 평균, 중앙값, 사분위수 같은 주요 요약 통계를 간결하게 나타냅니다.
  • 중앙선 : 중앙값
  • 상자의 위쪽과 아래쪽 경계 : 제 3사분위수, 제 1사분위수
  • 상자 바깥의 선 : 최댓값과 최솟값
  • 이상치 : 별도의 점으로 나타내며 대체로 데이터의 98번째 혹은 99번째 백분위 수 바깥에 위치

 

2. 예시

  • 먼저 필요한 라이브러리와 데이터세트를 불러옵니다.
import numpy as np
import pandas as pd

import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv('../data/fuel-econ/csv')
df.head(5)

  • 바이올린 플롯과 마찬가지로 상자 그림도 정량적 변수와 정성적 변수의 관계를 나타낼 때 사용됩니다.
  • matplotlib과 seaborn 모두에 boxplot이라는 메서드가 있습니다.
  • 여기서는 seaborn의 boxplot()함수를 사용해보겠습니다.
ax1 = sns.boxplot(data=df, x='VClass', y='comb', color='tab:blue')
plt.xticks(rotation=15);
plt.ylim(ax1.get_ylim())

 

  • 가로 방향의 상자 그림도 나타낼 수 있습니다.
sns.boxplot(data=fuel_econ, y='VClass', x='comb', color='tab:blue')

728x90
반응형