일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |
- 코드잇TIL
- 경사하강법
- matplotlib
- 데이터분석
- HTML
- 윈도우함수
- 판다스
- 코딩
- CSS
- 코딩독학
- 로지스틱회귀
- 선형회귀
- 코드잇 TIL
- sql연습문제
- 메소드
- 서브쿼리
- 오늘도코드잇
- 코딩공부
- pandas
- 다항회귀
- 머신러닝
- numpy
- 행렬
- Seaborn
- for반복문
- 나혼자코딩
- SQL
- 파이썬
- 결정트리
- 코드잇
- Today
- Total
목록파이썬 (45)
Coding Diary.
저번 글에서는 데이터 구조 유형 중 리스트에 대해 알아보았습니다. 이번 글에서는 튜플과 세트에 대해 알아보겠습니다. 🔻(참고)리스트🔻 (파이썬) 데이터 구조의 유형 중 가장 많이 쓰이는 리스트 총정리1. 데이터 구조데이터 구조란 다양한 방식으로 데이터 유형들을 모아 조직하고 그룹화하는 데이터 컨테니어 혹은 데이터 컬렉션입니다.데이터가 담긴 파일들을 정리해 놓은 파일 폴더라고 볼life-of-nomad.tistory.com1. 튜플(tuples)튜플은 순서가 있는 변형가능하지 않는(immutable) 요소들을 담는 데이터 유형입니다.튜플은 흔히 서로 관련이 있는 정보들을 저장하는데 사용됩니다.예를 들어 위도와 경도가 있습니다.location = (13.4125, 103.866667)print("Lat..
1. 데이터 구조데이터 구조란 다양한 방식으로 데이터 유형들을 모아 조직하고 그룹화하는 데이터 컨테니어 혹은 데이터 컬렉션입니다.데이터가 담긴 파일들을 정리해 놓은 파일 폴더라고 볼 수 있습니다.2. 리스트리스트는 파이썬에서 자주 사용되는 데이터 구조입니다.대괄호[]를 사용합니다.리스트에는 모든 데이터 유형을 섞고 매칭시켜 담을 수 있습니다.list_of_random_things = [1, 3.4, 'a string', True]이 리스트에는 4개의 요소가 있습니다. 3. 리스트의 특징1) 인덱싱리스트처럼 순서가 있는 모든 컨테이너에는 파이썬에서 인덱스 0부터 인덱싱됩니다.그러므로 위의 리스트에서 첫 번째 값을 가져오려면 아래와 같이 작성할 수 있습니다.list_of_random_things[0]#결과1..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/wsZjh/btsHCokJz3b/MOJLRgcGUkj42oreVZEWxK/img.png)
두 숫자 변수 사이에 존재하는 관계를 조사할 때 대표적으로 활용하는 차트는 산점도입니다.이번 글에서는 산점도와 matplotlib으로 그리는 방법에 대해 알아보겠습니다. 1. 산점도산점도에서 각 데이터 포인트는 하나의 점으로 표현되며, x축과 y축에서의 위치는 각각 서로 다른 변수에 따라 결정됩니다.산점도는 두 개의 정량적 변수 간에 존재하는 관계를 나타낼 때 사용합니다.이 때 두 변수는 각각 x축과 y축을 통해 표시됩니다.산점도를 작성하면 두 변수 사이에 존재하는 상관관계를 분명하게 확인할 수 있습니다. 2. 상관관계두 변수 사이에 존재하는 상관관계의 강도는 상관계수로 나타냅니다. 피어슨 상관관계 (Pearson correlation coefficient) : 선형적인 관계를 반영하며 그 값은 최소 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cbWTvR/btsHCUbZpof/PMrWv51QWlrICvTmbVPO40/img.png)
지난 글에 이어 이번에는 불연속 데이터의히스토그램, 막대그래프를 나타내는방법에 대해 알아보겠습니다. 🔻막대그래프🔻 (데이터분석) seaborn과 matplotlib으로 막대그래프 작성하기1. Seaborn으로 막대 그래프 작성하기도수를 나타내는 기본적인 막대 그래프는 seaborn의 countplot함수를 사용하여 작성할 수 있습니다.seaborn.countplot(*, x=None, y=None, data=None, order=None, orient=None, color=None)life-of-nomad.tistory.com🔻히스토그램🔻 (데이터분석) seaborn과 matplotlib으로 히스토그램 나타내기히스토그램은 숫자 변수의 분포를 나타낼 때 사용합니다. 막대 그래프를 정량적 변수에 적용..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bsVhdc/btsHCAEQgm0/LWd4sLACt8jAomgS8JAJW0/img.png)
지난 글에서 설명한 matplotlib에 이어figure, axes, subplots에 대해 알아보겠습니다. (데이터분석) seaborn과 matplotlib으로 히스토그램 나타내기히스토그램은 숫자 변수의 분포를 나타낼 때 사용합니다. 막대 그래프를 정량적 변수에 적용한 것과 같습니다.하지만 하나의 막대로 각 고유 범주에 속하는 값의 개수를 나타내는 대신, 값을life-of-nomad.tistory.com 먼저, seaborn은 matplotlib을 기반으로 구축되었습니다. 알려드릴 내용은 seaborn에도 적용됩니다. 참고로, seaborn을 이용하면 더욱 간단하게 할 수 있습니다.1. Figures, Axes, and Subplots먼저, 데이터를 불러오겠습니다.import numpy as npim..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/eN4qll/btsHAQATYIp/hL3qF42QXIjzLBaAifKHk0/img.png)
히스토그램은 숫자 변수의 분포를 나타낼 때 사용합니다. 막대 그래프를 정량적 변수에 적용한 것과 같습니다.하지만 하나의 막대로 각 고유 범주에 속하는 값의 개수를 나타내는 대신, 값을 연속적인 계급으로 나눈 다음 하나의 막대로 각 계급에 속하는 값의 개수를 나타냅니다. seaborn과 matplotlib으로 나타낼 수 있습니다.1. Matplotlib.pyplot.hist()import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsdf = pd.read_csv('diamonds.csv')df.shapedf.head(5)다이아몬드의 x,y,z축 길이를 확인하려고 합니다.이 값은 mm단위로 입력되어 있습니다..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dCnZkM/btsHAtsjJNH/9OotIJ0eUrWPXmePUUBsAk/img.png)
1. 원 그래프 작성 방법1) matplotlib.pyplot.pie()원 그래프는 matplotlib의 matplotlib.pyplot.pie() 함수로 작성할 수 있습니다.matplotlib.pyplot.pie(x_data, labels, colors, startangle, counterclock, wedgeprops)2) matplotlib.pyplot.axis()축의 속성 설정하기 위해서는 matplotlib.pyplot.axis() 함수를 적용하면 됩니다.*args : 함수에 전달할 인수**kwargs : 딕셔너리 형태로 전달되는 키워드 인수3) 원 그래프 예시sorted_counts = df['clarity'].value_counts()#첫번째 부채꼴이 수직으로 위쪽을 향하게, 정렬된 범주가 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/XYTc9/btsHzandkLh/jFKYiFGHHXaOoyivQg2vm0/img.png)
🔻지난글🔻에서 seaborn과 matplotlib으로 막대그래프 나타내는 방법을 알아보았습니다.이번 글에서는 절대도수와 상대도수의 막대그래프를 나타내는 방법에 대해 알아보겠습니다. (데이터분석) seaborn과 matplotlib으로 막대그래프 작성하기1. Seaborn으로 막대 그래프 작성하기도수를 나타내는 기본적인 막대 그래프는 seaborn의 countplot함수를 사용하여 작성할 수 있습니다.seaborn.countplot(*, x=None, y=None, data=None, order=None, orient=None, color=None)life-of-nomad.tistory.com1. 절대 도수를 나타내는 수평 막대 그래프 작성하기먼저, 필요한 패키지를 불러오고, csv 파일을 읽습니다.i..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/clCaip/btsHuJ4mxEo/X70MwHX7Huhy1JUwK0ZiBK/img.png)
데이터의 문제점을 해결하고 나서는 바로 시각적 방식이나 프로그래밍 방식의 평가를 통해서 정제 작업이 성공적이었다는 것을 확인해야 합니다. 즉, 평가 및 테스트의 워크플로를 효과적으로 구성해야 합니다.* Test-Driven development(테스트 주도 개발) : 소프트웨어 개발을 완료하기 전에 지속적인 테스트를 수행하여 소프트웨어의 효과성을 검증하는 것이 글에서는 데이터 정제 작업의 효과를 평가하는 방법을 알아보겠습니다. 1. Heatmap 이용하기먼저, .head() 나 .tail()을 이용해서 데이터를 시각적으로 살펴볼 수 있습니다.#import librariesimport pandas as pdimport numpy as npimport seaborn as sns#Read the .json ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/DlvbY/btsHwyGXOd2/nJjOvPwJotvTvQIIY2LKNk/img.png)
파이썬의 datetime 이용해서 time series(시계열) 데이터를 정제해보겠습니다.time series는 시간에 따른 데이터를 저장할 때 자주 사용되는 데이터 형식입니다. 이는 일정한 시간 간격으로 수집한 일련의 데이터 포인트들로써 시간에 따른 추세, 패턴을 분석하거나 예측하는 데 사용됩니다.이 글에서는 pandas에서 날짜 데이터를 처리하고 시계열 데이터를 정제하는 방법을 알아보겠습니다.time series(시계열) datetime 모듈에 대한 참고자료는 아래와 같습니다. (파이썬 코딩일기) datetime 모듈import datetime스탠다드 라이브러리에 있는 datetime 모듈은 '날짜'와 '시간'을 다루기 위한 다양한 '클래스'를 갖추고 있습니다. 1. datetime 값 생성2020..