일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 머신러닝
- 코딩독학
- 로지스틱회귀
- Seaborn
- SQL
- 유학생
- 런던
- 영국석사
- numpy
- 행렬
- 나혼자코딩
- 코딩공부
- 코드잇
- 선형회귀
- 다항회귀
- 파이썬
- 코드잇TIL
- matplotlib
- 코드잇 TIL
- 판다스
- 윈도우함수
- HTML
- sql연습문제
- 결정트리
- 데이터분석
- 경사하강법
- 오늘도코드잇
- for반복문
- 코딩
- CSS
- Today
- Total
목록matplotlib (8)
영국 척척석사 유학생 일기장👩🏻🎓
이번 글에서는 이변량 차트의 응용 방법에 대해 알아보겠습니다. 1. 차급과 변속기 종류에 따른 다변량 연비 차트먼저 필요한 라이브러리를 불러오고 연비 데이터 세트를 가져오고 변속기 종류를 추출하겠습니다.import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsdf = pd.read_csv('../data/fuel-econ/csv')df['trans_type'] = df['trans'].apply(lambda x:x.split()[0])seaborn 차트에 색상을 추가할 때는 매개변수 hue를 추가하면 됩니다. sns.pointplot(data=df, x='VClass', y='comb', hue='tr..
지난 글에서 이변량 변수를 나타낼 때 자주 쓰이는 산점도에 대해 알아보았습니다. 이번 글에서는 세개 이상의 변수를 나타낼 때 쓰는 방법에 대해 알아보겠습니다. 🔻(참고)산점도(scatterplot)🔻 (데이터분석) 산점도(scatterplots) 개념 및 matplotlib, seaborn으로 그리기두 숫자 변수 사이에 존재하는 관계를 조사할 때 대표적으로 활용하는 차트는 산점도입니다.이번 글에서는 산점도와 matplotlib으로 그리는 방법에 대해 알아보겠습니다. 1. 산점도산점도에서life-of-nomad.tistory.com 1. 세 개의 변수세 개의 변수를 차트에 나타내는 경우는 크게 네 가지가 존재합니다.세 개의 숫자 변수두 개의 숫자 변수와 한 개의 범주형 변수한 개의 숫자 변수와 두 ..
1. 선도표선도표는 하나의 숫자 변수가 두 번째 변수에 따라서 변화하는 동향을 나타내기 위해 자주 사용되는 차트입니다.모든 데이터 포인터가 표시되는 산점도와 달리 선도표는 모든 고유의 x값 혹은 x의 계급에 대해 오직 하나의 점만 차트에 표시됩니다. x의 계급에 여러 개의 관찰값이 존재할 때는 해당 계급 내 데이터의 평균이나 중앙값과 같은 요약 통계를 y축 값으로 차트에 표시합니다.x변수가 시간을 나타낼 때는 해당 데이터를 나타낸 선도표를 시계열 차트라고 부릅니다. ex) 주가나 환율을 나타내는 차트는 각 시점에 오직 하나의 관찰값만 표시됩니다. 선도표는 Matplotlib으로 나타낼 수 있습니다. 2. matplolib으로 나타내기점 사이 선을 표시하는 matplotlib의 error bar 함수를 ..
1. 히트맵히트맵은 일종의 이차원 히스토그램으로 산점도를 대체할 수 있는 차트입니다.두 숫자 변수의 값들이 두 개의 축을 기준으로 평면에 표시된다는 점에서 산점도와 유사합니다.한편, 데이터 포인트가 표시되는 영역은 격자 모양으로 분할되며, 각각의 격자 셀에는 그 안에 존재하는 점의 개수가 표시된다느 ㄴ점에서 히스토그램과 유사합니다.하지만, 히트맵에는 막대의 높이를 표현할 공간이 없으며 격자 셀의 색상을 통해 그 안에 존재하는 점의 개수를 나타냅니다.히트맵은 matplotlib의 hist2d() 함수를 사용해 작성할 수 있습니다.히트맵을 사용하는 경우는 아래의 두 가지입니다.1) 두 가지 불연속 변수를 나타내는 차트를 작성할 때2) 대량의 데이터 포인트가 존재할 때 투명도 대신 사용 2. 예시1) Matp..
두 숫자 변수 사이에 존재하는 관계를 조사할 때 대표적으로 활용하는 차트는 산점도입니다.이번 글에서는 산점도와 matplotlib으로 그리는 방법에 대해 알아보겠습니다. 1. 산점도산점도에서 각 데이터 포인트는 하나의 점으로 표현되며, x축과 y축에서의 위치는 각각 서로 다른 변수에 따라 결정됩니다.산점도는 두 개의 정량적 변수 간에 존재하는 관계를 나타낼 때 사용합니다.이 때 두 변수는 각각 x축과 y축을 통해 표시됩니다.산점도를 작성하면 두 변수 사이에 존재하는 상관관계를 분명하게 확인할 수 있습니다. 2. 상관관계두 변수 사이에 존재하는 상관관계의 강도는 상관계수로 나타냅니다. 피어슨 상관관계 (Pearson correlation coefficient) : 선형적인 관계를 반영하며 그 값은 최소 ..
지난 글에서 설명한 축(axis)범위 변경에 이어 축의 척도(scale) 변환하는 방법에 대해 알아보겠습니다. 🔻seaborn, matplotlib 축 변환하기🔻 (데이터분석) seaborn, matplotlib으로 axis(축) 범위 변경지난 글에 이어 seaborn과 matplotlib에서axis(축) 범위를 변경하는 방법과 outlier(이상치)의 존재여부를 알아보겠습니다. 🔻seaborn, matplolib 히스토그램 작성법🔻 (데이터분석) seaborn과 matplotlib으로life-of-nomad.tistory.com 1. Scales and Transformations먼저, 필요한 라이브러리와 데이터세트를 불러옵니다.import numpy as npimport pandas as pd..
지난 글에서 설명한 matplotlib에 이어figure, axes, subplots에 대해 알아보겠습니다. (데이터분석) seaborn과 matplotlib으로 히스토그램 나타내기히스토그램은 숫자 변수의 분포를 나타낼 때 사용합니다. 막대 그래프를 정량적 변수에 적용한 것과 같습니다.하지만 하나의 막대로 각 고유 범주에 속하는 값의 개수를 나타내는 대신, 값을life-of-nomad.tistory.com 먼저, seaborn은 matplotlib을 기반으로 구축되었습니다. 알려드릴 내용은 seaborn에도 적용됩니다. 참고로, seaborn을 이용하면 더욱 간단하게 할 수 있습니다.1. Figures, Axes, and Subplots먼저, 데이터를 불러오겠습니다.import numpy as npim..
히스토그램은 숫자 변수의 분포를 나타낼 때 사용합니다. 막대 그래프를 정량적 변수에 적용한 것과 같습니다.하지만 하나의 막대로 각 고유 범주에 속하는 값의 개수를 나타내는 대신, 값을 연속적인 계급으로 나눈 다음 하나의 막대로 각 계급에 속하는 값의 개수를 나타냅니다. seaborn과 matplotlib으로 나타낼 수 있습니다.1. Matplotlib.pyplot.hist()import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsdf = pd.read_csv('diamonds.csv')df.shapedf.head(5)다이아몬드의 x,y,z축 길이를 확인하려고 합니다.이 값은 mm단위로 입력되어 있습니다..