일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 |
- 머신러닝
- 코드잇
- sql연습문제
- numpy
- 코드잇TIL
- CSS
- HTML
- matplotlib
- 나혼자코딩
- 윈도우함수
- pandas
- 경사하강법
- Seaborn
- 코드잇 TIL
- 코딩공부
- 오늘도코드잇
- for반복문
- 결정트리
- 파이썬
- 다항회귀
- 판다스
- 메소드
- 데이터분석
- 서브쿼리
- 선형회귀
- 코딩
- 로지스틱회귀
- 코딩독학
- SQL
- 행렬
- Today
- Total
목록판다스 (8)
Coding Diary.
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cUpVgS/btsH2H6c1mq/lFelmFComPfRXiNxaIajJK/img.png)
지난 글에서는 판다스 데이터프레임의 요소에 액세스 하고 행, 열을 추가하고 제거하는 방법에 대해 알아보았습니다. 이번 글에서는 여러 가지 방법으로 NaN 값을 다루는 방법에 대해 알아보겠습니다. 🔻(참고)데이터프레임 행,열 추가 및 제거🔻 (파이썬) 판다스 데이터프레임(pandas dataframe) 행, 열 추가 및 제거지난 글에서 판다스 데이터프레임을 직접 만드는 방법에 대해 알아보았습니다. 이번 글에서는 판다스 데이터프레임의 요소에 액세스 하고 행, 열을 추가하고 제거하는 방법에 대해 알아보겠습life-of-nomad.tistory.com우리는 대규모 데이터세트로 머신 러닝 알고리즘을 훈련시키기 전에 보통 먼저 데이터를 정리해야 합니다.즉, 데이터에 있는 오류를 검출하고 시정할 방법이 필요하다는..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/ZWTOt/btsH26YJqnH/BKBPKr6j8lxW0a5o67QcIK/img.png)
지난 글에서 판다스 데이터프레임을 직접 만드는 방법에 대해 알아보았습니다. 이번 글에서는 판다스 데이터프레임의 요소에 액세스 하고 행, 열을 추가하고 제거하는 방법에 대해 알아보겠습니다. 🔻(참고)데이터프레임 만들기🔻 (파이썬) Pandas DataFrame 판다스 데이터프레임 만들기지난 글에서 Pandas Series 만드는 방법과 요소에 액세스 하고 삭제, 산술 연산 하는 방법에 대해 알아보았습니다.이번 글에서는 판다스 데이터프레임을 직접 만드는 방법에 대해 알아보겠습니다. life-of-nomad.tistory.com우리는 다양한 방식으로 판다스 데이터프레임에 있는 요소에 액세스할 수 있습니다.일반적으로는 행 레이블과 열 레이블을 사용하여 데이터프레임의 행, 열 또는 개별 요소에 액세스할 수 있..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/55FWK/btsH1NrnV9G/FTfpe1A9QKZkF0EHLAIqGK/img.png)
지난 글에서 Pandas Series 만드는 방법과 요소에 액세스 하고 삭제, 산술 연산 하는 방법에 대해 알아보았습니다.이번 글에서는 판다스 데이터프레임을 직접 만드는 방법에 대해 알아보겠습니다. 🔻(참고)판다스 산술연산🔻 (파이썬) 판다스 시리즈(Pandas Series)에 대한 산술 연산지난 글에서 판다스 시리즈를 만들고 요소에 액세스하고 삭제하는 방법에 대해 알아보았습니다. 이번 글에서는 판다스 시리즈의 산술 연산하는 방법에 대해 알아보겠습니다. 🔻(참고)판다스life-of-nomad.tistory.com🔻(참고)판다스 시리즈 만들기🔻 (파이썬) 판다스(Pandas) 시리즈 만들기, .loc/.iloc 이용해서 요소들에 액세스하고 삭제하기지난 글에서 넘파이(NumPy)에 대해 알아보았습니..
지난 글에서 판다스 시리즈를 만들고 요소에 액세스하고 삭제하는 방법에 대해 알아보았습니다. 이번 글에서는 판다스 시리즈의 산술 연산하는 방법에 대해 알아보겠습니다. 🔻(참고)판다스 시리즈🔻 (파이썬) 판다스(Pandas) 시리즈 만들기, .loc/.iloc 이용해서 요소들에 액세스하고 삭제하기지난 글에서 넘파이(NumPy)에 대해 알아보았습니다. 이번 글에서는 판다스(Pandas)의 시리즈 만드는 방법, 요소에 액세스하고 삭제하는 방법에 대해 알아보겠습니다. 🔻(참고)넘파이🔻 (파이썬) Nlife-of-nomad.tistory.comNumPy ndarray와 마찬가지로 Pandas Series에 대해서도 요소 단위로 산술 연산을 할 수 있습니다.먼저, 과일 만으로 된 식료품 목록이 담긴 새로운 P..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/LHmRi/btsH3wIpFr2/cMVzWIljScj8jETmXK6KsK/img.png)
지난 글에서 넘파이(NumPy)에 대해 알아보았습니다. 이번 글에서는 판다스(Pandas)의 시리즈 만드는 방법, 요소에 액세스하고 삭제하는 방법에 대해 알아보겠습니다. 🔻(참고)넘파이🔻 (파이썬) NumPy 부울 값 인덱싱, 집합 연산, np.sort() 정렬이전 글에서 NumPy의 슬라이싱을 이용하여 요소들을 선택하는 방법을 알아보았습니다. 선택하려는 요소의 정확한 인덱스를 알고 있을 때는 그 방법이 유용하지만, 선택하려는 요소의 인덱스를life-of-nomad.tistory.com 1. NumPy ndarray와 Pandas Series 의 차이점둘의 가장 큰 차이점은 판다스 시리즈는 각각의 요소에 인덱스 레이블을 지정할 수 있다는 점입니다. 즉, 판다스 시리즈의 인덱스에 원하는 대로 이름을 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dCnZkM/btsHAtsjJNH/9OotIJ0eUrWPXmePUUBsAk/img.png)
1. 원 그래프 작성 방법1) matplotlib.pyplot.pie()원 그래프는 matplotlib의 matplotlib.pyplot.pie() 함수로 작성할 수 있습니다.matplotlib.pyplot.pie(x_data, labels, colors, startangle, counterclock, wedgeprops)2) matplotlib.pyplot.axis()축의 속성 설정하기 위해서는 matplotlib.pyplot.axis() 함수를 적용하면 됩니다.*args : 함수에 전달할 인수**kwargs : 딕셔너리 형태로 전달되는 키워드 인수3) 원 그래프 예시sorted_counts = df['clarity'].value_counts()#첫번째 부채꼴이 수직으로 위쪽을 향하게, 정렬된 범주가 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/balbLv/btsHi6YQhOC/pJZkXllQJqllBhCEBiMtKK/img.png)
zipfile 이용하기zipfile.ZipFile을 통해 ZipFile 클래스에 엑세스해서 zipfile 라이브러리로부터 zip파일을 읽고 쓸 수 있게 합니다."r"을 지정하여 tiny_csv_zip이라는 이름의 zip파일을 읽기모드에서 열고 zip_ref라는 파일 객체를 생성합니다.extractall 함수를 사용해서 zip파일 내의 모든 파일을 tiny_csv라는 이름의 새 폴더로 추출합니다.pandas 이용해서 tiny_csv폴더에서 csv파일을 읽어서 DataFrame 으로 반환합니다.문제점pandas가 세미콜론(;)을 제대로 처리하지 못합니다. (pandas는 기본적으로 쉼표로 값을 구분하기 때문)테스트 결과가 없는 것이 존재합니다. No Test Taken => 누락값은 NA로 나타내는게 적합합..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bhdXrB/btstMCJYLCb/6RB17YQTlEKUkB3hgxxxPK/img.png)
이름으로 인덱싱하기 기본 형태 단축 형태 하나의 row 이름 df.loc["row4"] row 이름의 리스트 df.loc[["row4", "row5", "row3"]] row 이름의 리스트 슬라이싱 df.loc["row2":"row5"] df.["row2":"row5"] 하나의 column 이름 df.loc[:, "col1"] df["col1"] column 이름의 리스트 df.loc[:, ["col4", "col6", "col3"] df[["col4", "col6", "col3"]] column 이름의 리스트 슬라이싱 df.loc[:, "col2":"col5"] 위치로 인덱싱하기 기본 형태 단축 형태 하나의 row 위치 df.iloc[8] row 위치의 리스트 df.iloc[[4, 5, 3]] row ..