목록판다스 (8)
영국 척척석사 유학생 일기장👩🏻🎓
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/cUpVgS/btsH2H6c1mq/lFelmFComPfRXiNxaIajJK/img.png)
지난 글에서는 판다스 데이터프레임의 요소에 액세스 하고 행, 열을 추가하고 제거하는 방법에 대해 알아보았습니다. 이번 글에서는 여러 가지 방법으로 NaN 값을 다루는 방법에 대해 알아보겠습니다. 🔻(참고)데이터프레임 행,열 추가 및 제거🔻 (파이썬) 판다스 데이터프레임(pandas dataframe) 행, 열 추가 및 제거지난 글에서 판다스 데이터프레임을 직접 만드는 방법에 대해 알아보았습니다. 이번 글에서는 판다스 데이터프레임의 요소에 액세스 하고 행, 열을 추가하고 제거하는 방법에 대해 알아보겠습life-of-nomad.tistory.com우리는 대규모 데이터세트로 머신 러닝 알고리즘을 훈련시키기 전에 보통 먼저 데이터를 정리해야 합니다.즉, 데이터에 있는 오류를 검출하고 시정할 방법이 필요하다는..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/ZWTOt/btsH26YJqnH/BKBPKr6j8lxW0a5o67QcIK/img.png)
지난 글에서 판다스 데이터프레임을 직접 만드는 방법에 대해 알아보았습니다. 이번 글에서는 판다스 데이터프레임의 요소에 액세스 하고 행, 열을 추가하고 제거하는 방법에 대해 알아보겠습니다. 🔻(참고)데이터프레임 만들기🔻 (파이썬) Pandas DataFrame 판다스 데이터프레임 만들기지난 글에서 Pandas Series 만드는 방법과 요소에 액세스 하고 삭제, 산술 연산 하는 방법에 대해 알아보았습니다.이번 글에서는 판다스 데이터프레임을 직접 만드는 방법에 대해 알아보겠습니다. life-of-nomad.tistory.com우리는 다양한 방식으로 판다스 데이터프레임에 있는 요소에 액세스할 수 있습니다.일반적으로는 행 레이블과 열 레이블을 사용하여 데이터프레임의 행, 열 또는 개별 요소에 액세스할 수 있..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/55FWK/btsH1NrnV9G/FTfpe1A9QKZkF0EHLAIqGK/img.png)
지난 글에서 Pandas Series 만드는 방법과 요소에 액세스 하고 삭제, 산술 연산 하는 방법에 대해 알아보았습니다.이번 글에서는 판다스 데이터프레임을 직접 만드는 방법에 대해 알아보겠습니다. 🔻(참고)판다스 산술연산🔻 (파이썬) 판다스 시리즈(Pandas Series)에 대한 산술 연산지난 글에서 판다스 시리즈를 만들고 요소에 액세스하고 삭제하는 방법에 대해 알아보았습니다. 이번 글에서는 판다스 시리즈의 산술 연산하는 방법에 대해 알아보겠습니다. 🔻(참고)판다스life-of-nomad.tistory.com🔻(참고)판다스 시리즈 만들기🔻 (파이썬) 판다스(Pandas) 시리즈 만들기, .loc/.iloc 이용해서 요소들에 액세스하고 삭제하기지난 글에서 넘파이(NumPy)에 대해 알아보았습니..
지난 글에서 판다스 시리즈를 만들고 요소에 액세스하고 삭제하는 방법에 대해 알아보았습니다. 이번 글에서는 판다스 시리즈의 산술 연산하는 방법에 대해 알아보겠습니다. 🔻(참고)판다스 시리즈🔻 (파이썬) 판다스(Pandas) 시리즈 만들기, .loc/.iloc 이용해서 요소들에 액세스하고 삭제하기지난 글에서 넘파이(NumPy)에 대해 알아보았습니다. 이번 글에서는 판다스(Pandas)의 시리즈 만드는 방법, 요소에 액세스하고 삭제하는 방법에 대해 알아보겠습니다. 🔻(참고)넘파이🔻 (파이썬) Nlife-of-nomad.tistory.comNumPy ndarray와 마찬가지로 Pandas Series에 대해서도 요소 단위로 산술 연산을 할 수 있습니다.먼저, 과일 만으로 된 식료품 목록이 담긴 새로운 P..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/LHmRi/btsH3wIpFr2/cMVzWIljScj8jETmXK6KsK/img.png)
지난 글에서 넘파이(NumPy)에 대해 알아보았습니다. 이번 글에서는 판다스(Pandas)의 시리즈 만드는 방법, 요소에 액세스하고 삭제하는 방법에 대해 알아보겠습니다. 🔻(참고)넘파이🔻 (파이썬) NumPy 부울 값 인덱싱, 집합 연산, np.sort() 정렬이전 글에서 NumPy의 슬라이싱을 이용하여 요소들을 선택하는 방법을 알아보았습니다. 선택하려는 요소의 정확한 인덱스를 알고 있을 때는 그 방법이 유용하지만, 선택하려는 요소의 인덱스를life-of-nomad.tistory.com 1. NumPy ndarray와 Pandas Series 의 차이점둘의 가장 큰 차이점은 판다스 시리즈는 각각의 요소에 인덱스 레이블을 지정할 수 있다는 점입니다. 즉, 판다스 시리즈의 인덱스에 원하는 대로 이름을 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/dCnZkM/btsHAtsjJNH/9OotIJ0eUrWPXmePUUBsAk/img.png)
1. 원 그래프 작성 방법1) matplotlib.pyplot.pie()원 그래프는 matplotlib의 matplotlib.pyplot.pie() 함수로 작성할 수 있습니다.matplotlib.pyplot.pie(x_data, labels, colors, startangle, counterclock, wedgeprops)2) matplotlib.pyplot.axis()축의 속성 설정하기 위해서는 matplotlib.pyplot.axis() 함수를 적용하면 됩니다.*args : 함수에 전달할 인수**kwargs : 딕셔너리 형태로 전달되는 키워드 인수3) 원 그래프 예시sorted_counts = df['clarity'].value_counts()#첫번째 부채꼴이 수직으로 위쪽을 향하게, 정렬된 범주가 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/balbLv/btsHi6YQhOC/pJZkXllQJqllBhCEBiMtKK/img.png)
zipfile 이용하기zipfile.ZipFile을 통해 ZipFile 클래스에 엑세스해서 zipfile 라이브러리로부터 zip파일을 읽고 쓸 수 있게 합니다."r"을 지정하여 tiny_csv_zip이라는 이름의 zip파일을 읽기모드에서 열고 zip_ref라는 파일 객체를 생성합니다.extractall 함수를 사용해서 zip파일 내의 모든 파일을 tiny_csv라는 이름의 새 폴더로 추출합니다.pandas 이용해서 tiny_csv폴더에서 csv파일을 읽어서 DataFrame 으로 반환합니다.문제점pandas가 세미콜론(;)을 제대로 처리하지 못합니다. (pandas는 기본적으로 쉼표로 값을 구분하기 때문)테스트 결과가 없는 것이 존재합니다. No Test Taken => 누락값은 NA로 나타내는게 적합합..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bhdXrB/btstMCJYLCb/6RB17YQTlEKUkB3hgxxxPK/img.png)
이름으로 인덱싱하기 기본 형태 단축 형태 하나의 row 이름 df.loc["row4"] row 이름의 리스트 df.loc[["row4", "row5", "row3"]] row 이름의 리스트 슬라이싱 df.loc["row2":"row5"] df.["row2":"row5"] 하나의 column 이름 df.loc[:, "col1"] df["col1"] column 이름의 리스트 df.loc[:, ["col4", "col6", "col3"] df[["col4", "col6", "col3"]] column 이름의 리스트 슬라이싱 df.loc[:, "col2":"col5"] 위치로 인덱싱하기 기본 형태 단축 형태 하나의 row 위치 df.iloc[8] row 위치의 리스트 df.iloc[[4, 5, 3]] row ..