반응형
250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 오늘도코드잇
- Seaborn
- 데이터분석
- 코드잇
- 코딩공부
- 런던
- 선형회귀
- 유학생
- 다항회귀
- 윈도우함수
- CSS
- sql연습문제
- 파이썬
- SQL
- for반복문
- 코드잇 TIL
- 코딩
- matplotlib
- 코드잇TIL
- 나혼자코딩
- 머신러닝
- HTML
- numpy
- 영국석사
- 결정트리
- 코딩독학
- 로지스틱회귀
- 판다스
- 행렬
- 경사하강법
Archives
- Today
- Total
영국 척척석사 유학생 일기장👩🏻🎓
(데이터분석) seaborn, matplotlib으로 axis(축) 범위 변경 본문
728x90
반응형
지난 글에 이어 seaborn과 matplotlib에서
axis(축) 범위를 변경하는 방법과
outlier(이상치)의 존재여부를 알아보겠습니다.
🔻seaborn, matplolib 히스토그램 작성법🔻
1. Axis limits and Outliers
- 먼저, 라이브러이와 데이터세트를 불러옵니다.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv('diamonds.csv')
df.shape
df.head(5)
- 다이아몬드의 가격을 살펴보겠습니다.
bins = np.arange(0, df['price'].max()+100, 100)
plt.hist(data=df, x='price', bins=bins);
- 2000달러 주변을 보면 분포가 확 감소합니다.
- 어떤 문제인지 살펴보겠습니다.
2. Using xlim to zoom on a plot
- 이 부근을 확대하기 위해서는 xlim 함수를 사용해서 차트에 나타낼 상한과 하한을 정하면 됩니다.
- 하한을 1000달러, 상한을 5000달러로 정하겠습니다.
- 또한, 축 범위가 줄어들 것이므로 원래 100달러였던 계급의 크기를 50으로 줄이겠습니다.
bins = np.arange(0. df['price'].max()+50, 50)
plt.hist(data=df, x='price', bins=bins);
plt.xlim(1000, 5000)
- 결과를 보면 1500달러 부근에서 분포가 크게 꺼집니다.
- 소비자의 심리를 이용하는 가격 전략이 원인이 아닐까 예측합니다.
- 그 이유는 1500달러가 다이아몬드의 등급을 가르는 기준과 같은 가격이라
- 1500달러가 아닌 1499달러가 더 매력적인 가격으로 느껴질 수도 있기 때문입니다.
728x90
반응형
'코딩공부 > Data analysis' 카테고리의 다른 글
(데이터분석) 산점도(scatterplots) 개념 및 matplotlib, seaborn으로 그리기 (0) | 2024.05.26 |
---|---|
(데이터 분석) seaborn, matplotlib에서 축의 scale(척도) 변환하기 (0) | 2024.05.25 |
(데이터분석) 불연속 데이터에서의 히스토그램, 막대그래프 나타내기 (0) | 2024.05.25 |
(데이터분석) matplotlib의 figure, axes, subplots의 개념 (0) | 2024.05.25 |
(데이터분석) seaborn과 matplotlib으로 히스토그램 나타내기 (0) | 2024.05.24 |