일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 나혼자코딩
- 다항회귀
- 경사하강법
- numpy
- 로지스틱회귀
- for반복문
- Seaborn
- HTML
- 행렬
- sql연습문제
- 코드잇 TIL
- 판다스
- 오늘도코드잇
- 파이썬
- 윈도우함수
- 영국석사
- 코드잇TIL
- 선형회귀
- 결정트리
- 코딩공부
- matplotlib
- 코딩
- 코딩독학
- 유학생
- 런던
- 머신러닝
- CSS
- SQL
- 데이터분석
- 코드잇
- Today
- Total
목록코딩공부/Data analysis (39)
영국 척척석사 유학생 일기장👩🏻🎓
차트에 과도하게 많은 점이 존재하거나 주어진 숫자 변수가 불연속적일 경우, 주어진 그대로 산점도를 그려서 정보를 확인하기 어려울 수 있습니다. 차트 상에서 너무 많은 데이터 포인트가 겹치면서 과다 중첩(Overplotting)되어 변수들 간의 관계를 파악하기 어려워지기 때문입니다. 지난 글에 이어 산점도에서 과다 중첩을 해결하는 방법에 대해 알아보겠습니다. 🔻(지난 글) 산점도 그리기🔻 (데이터분석) 산점도(scatterplots) 개념 및 matplotlib, seaborn으로 그리기두 숫자 변수 사이에 존재하는 관계를 조사할 때 대표적으로 활용하는 차트는 산점도입니다.이번 글에서는 산점도와 matplotlib으로 그리는 방법에 대해 알아보겠습니다. 1. 산점도산점도에서life-of-nomad...
두 숫자 변수 사이에 존재하는 관계를 조사할 때 대표적으로 활용하는 차트는 산점도입니다.이번 글에서는 산점도와 matplotlib으로 그리는 방법에 대해 알아보겠습니다. 1. 산점도산점도에서 각 데이터 포인트는 하나의 점으로 표현되며, x축과 y축에서의 위치는 각각 서로 다른 변수에 따라 결정됩니다.산점도는 두 개의 정량적 변수 간에 존재하는 관계를 나타낼 때 사용합니다.이 때 두 변수는 각각 x축과 y축을 통해 표시됩니다.산점도를 작성하면 두 변수 사이에 존재하는 상관관계를 분명하게 확인할 수 있습니다. 2. 상관관계두 변수 사이에 존재하는 상관관계의 강도는 상관계수로 나타냅니다. 피어슨 상관관계 (Pearson correlation coefficient) : 선형적인 관계를 반영하며 그 값은 최소 ..
지난 글에서 설명한 축(axis)범위 변경에 이어 축의 척도(scale) 변환하는 방법에 대해 알아보겠습니다. 🔻seaborn, matplotlib 축 변환하기🔻 (데이터분석) seaborn, matplotlib으로 axis(축) 범위 변경지난 글에 이어 seaborn과 matplotlib에서axis(축) 범위를 변경하는 방법과 outlier(이상치)의 존재여부를 알아보겠습니다. 🔻seaborn, matplolib 히스토그램 작성법🔻 (데이터분석) seaborn과 matplotlib으로life-of-nomad.tistory.com 1. Scales and Transformations먼저, 필요한 라이브러리와 데이터세트를 불러옵니다.import numpy as npimport pandas as pd..
지난 글에 이어 seaborn과 matplotlib에서axis(축) 범위를 변경하는 방법과 outlier(이상치)의 존재여부를 알아보겠습니다. 🔻seaborn, matplolib 히스토그램 작성법🔻 (데이터분석) seaborn과 matplotlib으로 히스토그램 나타내기히스토그램은 숫자 변수의 분포를 나타낼 때 사용합니다. 막대 그래프를 정량적 변수에 적용한 것과 같습니다.하지만 하나의 막대로 각 고유 범주에 속하는 값의 개수를 나타내는 대신, 값을life-of-nomad.tistory.com1. Axis limits and Outliers먼저, 라이브러이와 데이터세트를 불러옵니다.import numpy as npimport pandas as pdimport matplotlib.pyplot as pl..
지난 글에 이어 이번에는 불연속 데이터의히스토그램, 막대그래프를 나타내는방법에 대해 알아보겠습니다. 🔻막대그래프🔻 (데이터분석) seaborn과 matplotlib으로 막대그래프 작성하기1. Seaborn으로 막대 그래프 작성하기도수를 나타내는 기본적인 막대 그래프는 seaborn의 countplot함수를 사용하여 작성할 수 있습니다.seaborn.countplot(*, x=None, y=None, data=None, order=None, orient=None, color=None)life-of-nomad.tistory.com🔻히스토그램🔻 (데이터분석) seaborn과 matplotlib으로 히스토그램 나타내기히스토그램은 숫자 변수의 분포를 나타낼 때 사용합니다. 막대 그래프를 정량적 변수에 적용..
지난 글에서 설명한 matplotlib에 이어figure, axes, subplots에 대해 알아보겠습니다. (데이터분석) seaborn과 matplotlib으로 히스토그램 나타내기히스토그램은 숫자 변수의 분포를 나타낼 때 사용합니다. 막대 그래프를 정량적 변수에 적용한 것과 같습니다.하지만 하나의 막대로 각 고유 범주에 속하는 값의 개수를 나타내는 대신, 값을life-of-nomad.tistory.com 먼저, seaborn은 matplotlib을 기반으로 구축되었습니다. 알려드릴 내용은 seaborn에도 적용됩니다. 참고로, seaborn을 이용하면 더욱 간단하게 할 수 있습니다.1. Figures, Axes, and Subplots먼저, 데이터를 불러오겠습니다.import numpy as npim..
히스토그램은 숫자 변수의 분포를 나타낼 때 사용합니다. 막대 그래프를 정량적 변수에 적용한 것과 같습니다.하지만 하나의 막대로 각 고유 범주에 속하는 값의 개수를 나타내는 대신, 값을 연속적인 계급으로 나눈 다음 하나의 막대로 각 계급에 속하는 값의 개수를 나타냅니다. seaborn과 matplotlib으로 나타낼 수 있습니다.1. Matplotlib.pyplot.hist()import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsdf = pd.read_csv('diamonds.csv')df.shapedf.head(5)다이아몬드의 x,y,z축 길이를 확인하려고 합니다.이 값은 mm단위로 입력되어 있습니다..
1. 원 그래프 작성 방법1) matplotlib.pyplot.pie()원 그래프는 matplotlib의 matplotlib.pyplot.pie() 함수로 작성할 수 있습니다.matplotlib.pyplot.pie(x_data, labels, colors, startangle, counterclock, wedgeprops)2) matplotlib.pyplot.axis()축의 속성 설정하기 위해서는 matplotlib.pyplot.axis() 함수를 적용하면 됩니다.*args : 함수에 전달할 인수**kwargs : 딕셔너리 형태로 전달되는 키워드 인수3) 원 그래프 예시sorted_counts = df['clarity'].value_counts()#첫번째 부채꼴이 수직으로 위쪽을 향하게, 정렬된 범주가 ..
🔻지난글🔻에서 seaborn과 matplotlib으로 막대그래프 나타내는 방법을 알아보았습니다.이번 글에서는 절대도수와 상대도수의 막대그래프를 나타내는 방법에 대해 알아보겠습니다. (데이터분석) seaborn과 matplotlib으로 막대그래프 작성하기1. Seaborn으로 막대 그래프 작성하기도수를 나타내는 기본적인 막대 그래프는 seaborn의 countplot함수를 사용하여 작성할 수 있습니다.seaborn.countplot(*, x=None, y=None, data=None, order=None, orient=None, color=None)life-of-nomad.tistory.com1. 절대 도수를 나타내는 수평 막대 그래프 작성하기먼저, 필요한 패키지를 불러오고, csv 파일을 읽습니다.i..
1. Seaborn으로 막대 그래프 작성하기도수를 나타내는 기본적인 막대 그래프는 seaborn의 countplot함수를 사용하여 작성할 수 있습니다.seaborn.countplot(*, x=None, y=None, data=None, order=None, orient=None, color=None) 1) 막대 그래프 색상 지정하기#필요한 패키지 불러오기import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns#csv 파일을 읽은 다음 뒤에서부터 10개의 행 확인하기df = pd.read_csv('diamonds.csv')print(df.shape)df.head(10)#명령문 끝에 세미콜론(;)을 추가하..