목록분류 전체보기 (184)
영국 척척석사 유학생 일기장👩🏻🎓
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bhdXrB/btstMCJYLCb/6RB17YQTlEKUkB3hgxxxPK/img.png)
이름으로 인덱싱하기 기본 형태 단축 형태 하나의 row 이름 df.loc["row4"] row 이름의 리스트 df.loc[["row4", "row5", "row3"]] row 이름의 리스트 슬라이싱 df.loc["row2":"row5"] df.["row2":"row5"] 하나의 column 이름 df.loc[:, "col1"] df["col1"] column 이름의 리스트 df.loc[:, ["col4", "col6", "col3"] df[["col4", "col6", "col3"]] column 이름의 리스트 슬라이싱 df.loc[:, "col2":"col5"] 위치로 인덱싱하기 기본 형태 단축 형태 하나의 row 위치 df.iloc[8] row 위치의 리스트 df.iloc[[4, 5, 3]] row ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/4wlJ9/btstK0R9gmN/5tSsaC7oyqYFfRst8EXu91/img.png)
pandas DataFrame에는 다양한 종류의 데이터를 담을 수 있습니다. dtypes를 사용해서 각 column이 어떤 데이터 타입을 보관하는지 확인할 수 있습니다. import pandas as pd two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], ['yoonsoo', 88, 75]] my_df = pd.DataFrame(two_dimensional_list, columns=['name', 'english_score', 'math_score'], index=['a','b','c', 'd']) print(my_df.dtypes) name object english_score int64 math_..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bA4svb/btstzxpK2id/dj8DnqVldpNXrQoHLDqS40/img.png)
1. 최댓값, 최솟값 max 메소드와 min 메소드를 사용하면 numpy array의 최댓값과 최솟값을 구할 수 있습니다. import numpy as np array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5]) print(array1.max()) #최댓값 print(array1.min()) # 최솟값 31 5 2. 평균값 mean 메소드를 사용하면 numpy array의 평균값을 구할 수 있습니다. import numpy as np array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5]) print(array1.mean()) #평균값 15.25 위 예시에서 총 합(14+6+13+21+23+31+9+5)을 총 개수(8)로 나누면 15.25 입..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/IcaHe/btstSkhbQ6C/WXJW6R9tM7w8YjGhnv9BYK/img.png)
1. numpy array를 만드는 방법 1) 파이썬 리스트를 통해 생성 numpy 모듈의 array 메소드에 따라 파라미터로 파이썬 리스트를 넘겨주면 numpy array가 리턴됩니다. array1 = numpy.array([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31]) print(array1) [2 3 4 7 11 13 17 19 23 29 31] 2) 균일한 값으로 생성 numpy 모듈의 full 메소드를 사용하면, 모든 값이 같은 nupmy array를 생성할 수 있습니다. array1 = numpy.full(6, 7) print(array1) [7 7 7 7 7 7] (1) 모든 값이 0인 numpy array 생성 모든 값이 0인 numpy array를 생성하기 위해..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/OB4A5/btstKX16Q7B/xBhCWj15wffhGXV63fLSCk/img.png)
데이터 사이언스의 단계 1. 문제 정의하기 2. 데이터 모으기 3. 데이터 다듬기 4. 데이터 분석하기 5. 데이터 시각화 및 커뮤니케이션 1) 문제 정의하기 해결하고자 하는 문제를 정의합니다. 이 단계에서는 해결하고자 하는 게 무엇인지, 언제까지 어떤 결과물을 얻을 것인지, 어떤 방식으로 데이터를 활용할 것인지 등을 설정합니다. => 목표 설정/ 기간 설정/ 평가 방법 설정/ 필요한 데이터 설정 2) 데이터 모으기 필요한 데이터를 모을 수 있는 방법을 찾습니다. 누군가 이미 모아 놓은 데이터를 그대로 사용할 수도 있고, 공공 기관 등에서 배포한 자료를 찾아 볼 수도 있고, 혹은 웹사이트에서 직접 데이터를 수집할 수도 있습니다. => 웹 크롤링/ 자료 모으기/ 파일 읽고 쓰기 3) 데이터 다듬기 데이터의..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/lb9f2/btstMfam0mS/JPGFKsCy1dg36eNd6ey4Ok/img.png)
파이썬에서 좋은 코드를 만들기 위한 가이드 중 PEP8에 대해 알아보겠습니다. 1. 이름1) 이름 규칙모든 변수와 함수 이름은 소문자로 쓰고 여러 단어일 경우 _로 나눕니다.# badsomeVariableName = 1SomeVariableName = 1def someFunctionName(): print("Hello")# goodsome_variable_name = 1def some_function_name(): print("Hello")모든 상수의 이름은 대문자로 쓰고 여러 단어일 경우 _로 나눕니다.# badsomeConstant = 3.14SomeConstant = 3.14some_constant = 3.14# goodSOME_CONSTANT = 3.142) 의미 있는 이름# bad (..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/brUaYQ/btstC1DVyAf/bQs48zsxehSoh14TqbFe5k/img.png)
자주 쓰이는 표현을 더 간략하게 쓸 수 있게 해주는 문법을 'syntactic sugar'라고 합니다.다음 아래의 두 줄은 같습니다.x = x+1x += 1x = x+2x += 2x = x*2x *= 2x = x-3x -= 3x = x/2x /= 2x = x%7x %= 7
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/mDDvZ/btstRQ1DoTj/XAYcU2GQUYqmrbNbVKhdP0/img.png)
파라미터에게 '기본값(default value)'을 설정할 수 있습니다.기본값을 설정해두면, 함수를 호출할 때 파라미터에 값을 안 넘겨줘도 됩니다.이러한 파라미터를 '옵셔널 파라미터(optional parameter)'라고 합니다. 아래의 코드를 보면 myself 함수를 호출할 때 한 번은 파라미터 nationality 에 들어갈 값을 제공했고, 한 번은 제공하지 않았습니다. def myself(name, age, nationality="한국"): print("내 이름은 {}".format(name)) print("내 나이는 {}살".format(age)) print("국적은 {}".format(nationality))print(myself("박보검", 1, "미국")) #옵셔널 파라미..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/EpEd0/btstH0rbRvS/vrLiHlB6QfoUKtg2TYhXTK/img.png)
이전 글에서 리스트에서 유용한 메소드에 대해 알아보았습니다. 그럼 함수와 메소드의 차이점은 무엇일까요? 이번 글에서는 함수와 메소드의 차이점과 문자열에서 유요한 메소드에 대해 알아보겠습니다. 🔻(참고)리스트 메소드🔻 (파이썬) 리스트와 리스트에서 유용한 메소드 총정리1. 리스트에서 값의 존재 확인하기어떤 값이 리스트에 있는지 여부를 확인하는 함수를 만들어보겠습니다.# value가 some_list의 요소인지 확인def in_list(some_list, value): i = 0 while i 위와 같이 실행하면life-of-nomad.tistory.com 1. 메소드(method)메소드는 함수와 관련이 있지만 함수와는 달리 메소드는 특정 유형의 객체와 연결됩니다.즉, 작업 중인 데이터 유형에 따라 다른..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/28OHy/btstQTj5oAF/kSOwAaYdLu3qcKO9Fjf7s0/img.png)
import datetime스탠다드 라이브러리에 있는 datetime 모듈은 '날짜'와 '시간'을 다루기 위한 다양한 '클래스'를 갖추고 있습니다. 1. datetime 값 생성2020년 3월 14일을 파이썬으로 어떻게 표현할 수 있을까요?pi_day = datetime.datetime(2020, 3, 14)print(pi_day)print(type(pi_day))>>> 2020-03-14 00:00:00위와 같이 시간은 자동으로 00시 00분 00초로 설정되는데 이 또한 직접 설정 가능합니다.pi_day = datetime.datetime(2020, 3, 14, 13, 6, 15)print(pi_day)print(type(pi_day))>>> 2020-03-14 13:06:15 2. 오늘 날짜우리가 날..