일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
- pandas
- matplotlib
- 행렬
- sql연습문제
- HTML
- 다항회귀
- 데이터분석
- 판다스
- numpy
- 선형회귀
- 메소드
- for반복문
- 결정트리
- 로지스틱회귀
- 경사하강법
- 오늘도코드잇
- 코드잇TIL
- 코딩공부
- Seaborn
- 머신러닝
- 코드잇 TIL
- 파이썬
- 코딩
- SQL
- 윈도우함수
- 서브쿼리
- CSS
- 코딩독학
- 코드잇
- 나혼자코딩
- Today
- Total
목록전체 글 (179)
Coding Diary.
1) Q1, Q3 구하기 데이터의 50% 지점을 의미하는 것이 중간값입니다. 이를 이용하면 Q1(데이터의 25%지점), Q3(데이터의 75%지점) 을 구할 수 있습니다. 예를 들어, 아래의 데이터에서 중간값은 86 입니다. 32, 48, 56, 78, 86, 96, 100, 120, 156 이 데이터를 중간값을 기준으로 둘로 나누었을 때, 첫번째 값부터 중간 값까지, 중간 값부터 마지막 값까지 둘로 나누었을 때, 왼쪽 묶음에서 의 중간값인 56이 25%에 해당하는 Q1값이라고 볼 수 있습니다. 반대로 오른쪽 묶음에 있는 중간값 100은 75% 지점, 즉 Q3이 됩니다. 하지만, 아래와 같이 Q1, Q2, Q3의 위치를 딱 정할 수 없는 경우도 있습니다. 데이터의 개수가 짝수일 때 중간값(Q2)를 구하려면..
이름으로 인덱싱하기 기본 형태 단축 형태 하나의 row 이름 df.loc["row4"] row 이름의 리스트 df.loc[["row4", "row5", "row3"]] row 이름의 리스트 슬라이싱 df.loc["row2":"row5"] df.["row2":"row5"] 하나의 column 이름 df.loc[:, "col1"] df["col1"] column 이름의 리스트 df.loc[:, ["col4", "col6", "col3"] df[["col4", "col6", "col3"]] column 이름의 리스트 슬라이싱 df.loc[:, "col2":"col5"] 위치로 인덱싱하기 기본 형태 단축 형태 하나의 row 위치 df.iloc[8] row 위치의 리스트 df.iloc[[4, 5, 3]] row ..
pandas DataFrame에는 다양한 종류의 데이터를 담을 수 있습니다. dtypes를 사용해서 각 column이 어떤 데이터 타입을 보관하는지 확인할 수 있습니다. import pandas as pd two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], ['yoonsoo', 88, 75]] my_df = pd.DataFrame(two_dimensional_list, columns=['name', 'english_score', 'math_score'], index=['a','b','c', 'd']) print(my_df.dtypes) name object english_score int64 math_..
1. 최댓값, 최솟값 max 메소드와 min 메소드를 사용하면 numpy array의 최댓값과 최솟값을 구할 수 있습니다. import numpy as np array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5]) print(array1.max()) #최댓값 print(array1.min()) # 최솟값 31 5 2. 평균값 mean 메소드를 사용하면 numpy array의 평균값을 구할 수 있습니다. import numpy as np array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5]) print(array1.mean()) #평균값 15.25 위 예시에서 총 합(14+6+13+21+23+31+9+5)을 총 개수(8)로 나누면 15.25 입..
1. numpy array를 만드는 방법 1) 파이썬 리스트를 통해 생성 numpy 모듈의 array 메소드에 따라 파라미터로 파이썬 리스트를 넘겨주면 numpy array가 리턴됩니다. array1 = numpy.array([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31]) print(array1) [2 3 4 7 11 13 17 19 23 29 31] 2) 균일한 값으로 생성 numpy 모듈의 full 메소드를 사용하면, 모든 값이 같은 nupmy array를 생성할 수 있습니다. array1 = numpy.full(6, 7) print(array1) [7 7 7 7 7 7] (1) 모든 값이 0인 numpy array 생성 모든 값이 0인 numpy array를 생성하기 위해..
데이터 사이언스의 단계 1. 문제 정의하기 2. 데이터 모으기 3. 데이터 다듬기 4. 데이터 분석하기 5. 데이터 시각화 및 커뮤니케이션 1) 문제 정의하기 해결하고자 하는 문제를 정의합니다. 이 단계에서는 해결하고자 하는 게 무엇인지, 언제까지 어떤 결과물을 얻을 것인지, 어떤 방식으로 데이터를 활용할 것인지 등을 설정합니다. => 목표 설정/ 기간 설정/ 평가 방법 설정/ 필요한 데이터 설정 2) 데이터 모으기 필요한 데이터를 모을 수 있는 방법을 찾습니다. 누군가 이미 모아 놓은 데이터를 그대로 사용할 수도 있고, 공공 기관 등에서 배포한 자료를 찾아 볼 수도 있고, 혹은 웹사이트에서 직접 데이터를 수집할 수도 있습니다. => 웹 크롤링/ 자료 모으기/ 파일 읽고 쓰기 3) 데이터 다듬기 데이터의..
파이썬에서 좋은 코드를 만들기 위한 가이드 중 PEP8에 대해 알아보겠습니다. 1. 이름1) 이름 규칙모든 변수와 함수 이름은 소문자로 쓰고 여러 단어일 경우 _로 나눕니다.# badsomeVariableName = 1SomeVariableName = 1def someFunctionName(): print("Hello")# goodsome_variable_name = 1def some_function_name(): print("Hello")모든 상수의 이름은 대문자로 쓰고 여러 단어일 경우 _로 나눕니다.# badsomeConstant = 3.14SomeConstant = 3.14some_constant = 3.14# goodSOME_CONSTANT = 3.142) 의미 있는 이름# bad (..
자주 쓰이는 표현을 더 간략하게 쓸 수 있게 해주는 문법을 'syntactic sugar'라고 합니다.다음 아래의 두 줄은 같습니다.x = x+1x += 1x = x+2x += 2x = x*2x *= 2x = x-3x -= 3x = x/2x /= 2x = x%7x %= 7
파라미터에게 '기본값(default value)'을 설정할 수 있습니다.기본값을 설정해두면, 함수를 호출할 때 파라미터에 값을 안 넘겨줘도 됩니다.이러한 파라미터를 '옵셔널 파라미터(optional parameter)'라고 합니다. 아래의 코드를 보면 myself 함수를 호출할 때 한 번은 파라미터 nationality 에 들어갈 값을 제공했고, 한 번은 제공하지 않았습니다. def myself(name, age, nationality="한국"): print("내 이름은 {}".format(name)) print("내 나이는 {}살".format(age)) print("국적은 {}".format(nationality))print(myself("박보검", 1, "미국")) #옵셔널 파라미..
이전 글에서 리스트에서 유용한 메소드에 대해 알아보았습니다. 그럼 함수와 메소드의 차이점은 무엇일까요? 이번 글에서는 함수와 메소드의 차이점과 문자열에서 유요한 메소드에 대해 알아보겠습니다. 🔻(참고)리스트 메소드🔻 (파이썬) 리스트와 리스트에서 유용한 메소드 총정리1. 리스트에서 값의 존재 확인하기어떤 값이 리스트에 있는지 여부를 확인하는 함수를 만들어보겠습니다.# value가 some_list의 요소인지 확인def in_list(some_list, value): i = 0 while i 위와 같이 실행하면life-of-nomad.tistory.com 1. 메소드(method)메소드는 함수와 관련이 있지만 함수와는 달리 메소드는 특정 유형의 객체와 연결됩니다.즉, 작업 중인 데이터 유형에 따라 다른..
import datetime스탠다드 라이브러리에 있는 datetime 모듈은 '날짜'와 '시간'을 다루기 위한 다양한 '클래스'를 갖추고 있습니다. 1. datetime 값 생성2020년 3월 14일을 파이썬으로 어떻게 표현할 수 있을까요?pi_day = datetime.datetime(2020, 3, 14)print(pi_day)print(type(pi_day))>>> 2020-03-14 00:00:00위와 같이 시간은 자동으로 00시 00분 00초로 설정되는데 이 또한 직접 설정 가능합니다.pi_day = datetime.datetime(2020, 3, 14, 13, 6, 15)print(pi_day)print(type(pi_day))>>> 2020-03-14 13:06:15 2. 오늘 날짜우리가 날..
1. randomimport random스탠다드 라이브러리에 있는 random 모듈은 랜덤한 숫자를 생성하기 위한 다양한 함수들을 제공해줍니다. 2. randint 함수randint 는 두 수 사이의 어떤 랜덤한 정수를 리턴하는 함수입니다.randint(a, b) 를 하면 a보다 크거나 같고 b보다 작거나 같은 어떤 랜덤한 정수 N을 리턴하는 것입니다.import randomprint(random.randint(1, 20))print(random.randint(1, 20))>>> 3>>> 17위와 같이 1이상, 20이하의 랜덤한 수가 출력됩니다. 3. uniform 함수uniform은 두 수 사이의 랜덤한 소수를 리턴하는 함수입니다.randint 와 다른 것은 리턴하는 값이 정수가 아니라 소수라는 점입니..