반응형
250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 선형회귀
- 판다스
- SQL
- CSS
- sql연습문제
- 데이터분석
- 유학생
- 행렬
- 로지스틱회귀
- 런던
- 코드잇TIL
- Seaborn
- 오늘도코드잇
- 경사하강법
- numpy
- 코드잇
- 영국석사
- 코딩공부
- 코딩독학
- 코드잇 TIL
- HTML
- 파이썬
- 다항회귀
- for반복문
- 윈도우함수
- 결정트리
- 머신러닝
- 코딩
- 나혼자코딩
- matplotlib
Archives
- Today
- Total
영국 척척석사 유학생 일기장👩🏻🎓
(데이터분석) numpy 기본 통계 본문
728x90
반응형
1. 최댓값, 최솟값
max 메소드와 min 메소드를 사용하면 numpy array의 최댓값과 최솟값을 구할 수 있습니다.
import numpy as np
array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5])
print(array1.max()) #최댓값
print(array1.min()) # 최솟값
31
5
2. 평균값
mean 메소드를 사용하면 numpy array의 평균값을 구할 수 있습니다.
import numpy as np
array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5])
print(array1.mean()) #평균값
15.25
위 예시에서 총 합(14+6+13+21+23+31+9+5)을 총 개수(8)로 나누면 15.25 입니다.
3. 중앙값
median 메소드를 사용하면 중간값을 구할 수 있습니다. 이때, median은 numpy array의 메소드가 아니라 numpy의 메소드입니다.
import numpy as np
array1 = np.array([8, 12, 9, 15, 16])
array2 = np.array([14, 6, 13, 21, 23, 31, 9, 5])
print(np.median(array1)) #중앙값
print(np.median(array2)) #중앙값
12.0
13.5
array1을 정렬하면 중앙값이 12입니다.
array2에는 짝수개의 요소가 있기 때문에 중앙값이 13과 14 두 개 입니다. 둘의 평균값을 내면 13.5 입니다.
4. 표준편차, 분산
표준편차와 분산은 값들이 평균에서 얼마나 떨어져 있는지 나타내는 지표입니다.
import numpy as np
array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5])
print(array1.std()) #표준편차
print(array1.var()) #분산
8.496322733983215
72.1875
728x90
반응형
'코딩공부 > Data analysis' 카테고리의 다른 글
(데이터분석) Q1, Q3, 이상값 (1) | 2023.06.17 |
---|---|
(데이터분석) pandas DataFrame 인덱싱 문법 정리 (0) | 2023.06.06 |
(데이터분석) pandas의 데이터 타입 (0) | 2023.06.01 |
(데이터분석) numpy array를 만드는 다양한 방법 (0) | 2023.05.27 |
(데이터분석) 데이터 사이언스 프로세스 (0) | 2023.05.25 |