반응형
250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 런던
- 코딩
- 경사하강법
- sql연습문제
- Seaborn
- 파이썬
- CSS
- 유학생
- 윈도우함수
- numpy
- 결정트리
- 판다스
- 선형회귀
- 데이터분석
- matplotlib
- 머신러닝
- 코딩공부
- 코딩독학
- 코드잇
- 오늘도코드잇
- HTML
- 코드잇TIL
- 나혼자코딩
- SQL
- 코드잇 TIL
- 행렬
- 영국석사
- 로지스틱회귀
- 다항회귀
- for반복문
Archives
- Today
- Total
영국 척척석사 유학생 일기장👩🏻🎓
(데이터분석) 파이썬의 requests 라이브러리 이용하여 파일 다운로드하기 본문
728x90
반응형
requests 라이브러리로 파일 다운로드하기
1) requrests 와 os 불러오기
2) 다운로드한 파일을 저장할 디렉터리 만들기
- os.path.exist : 파일 경로가 존재하는지 확인
- if not : 존재하지 않을 때만 디렉터리 만들기
3) url 리스트 만들기
4) requests
- requests.get(url)로 HTTP GET 요청 생성하기
- raise_for_statur 함수 : GET 요청에 오류가 발생했을 때 예외가 발생하도록 설정하기
- os.path.join : 콘텐츠를 다운로드할 파일 경로 구성하기 (folder_name과 url결합해서 이름으로 지정 위의 예시에서는 /로 구분된 것중 끝에서 첫번째 요소니깐 ebert_review_2017/1-the-wizard-of-oz-1939-film.txt가 됨)
- 파이썬의 open 함수를 사용해서 파일 경로로 지정한 파일을 바이너리 쓰기 모드(wb)로 열기 (url에서 가져와서 파일에 쓰는 응답 객체가 바이트로 되어있기 때문)
- file.write 함수 : 바이너리 content를 파일에 씀
- 네 번째 URL에 대한 코드 실행 안됨 (맨밑줄 보면 Bumblebee라는 불필요한 단어 있음) => 403 오류코드
5) os.listdir 이용해서 확인
- 나머지 세 개의 URL에 대해서는 해당 내용이 디렉터리에 제대로 저장되었는지 확인하기
# GET 요청 프로그래밍 방식 전송 상태
- 200-299코드 : 요청에 성공했음을 나타냄
- 400-599코드 : 오류가 발생했음
- 404오류 : 더 이상 존재하지 않는 웹사이트에 액세스할 때 반환
- 403오류 : URL은 유효하지만 클라이언트가 그에 액세스할 수 없음을 나타냄
728x90
반응형
'코딩공부 > Data analysis' 카테고리의 다른 글
(데이터분석) 파이썬 BeautifulSoup으로 웹 페이지 스크래핑하기 (0) | 2024.05.13 |
---|---|
(데이터분석) 파이썬의 glob 라이브러리 사용하여 텍스트파일 읽기 (0) | 2024.05.10 |
(데이터분석) 파이썬의 zipfile 이용하여 플랫파일 압축 해제하고 읽기 (0) | 2024.05.09 |
(데이터분석) Q1, Q3, 이상값 (1) | 2023.06.17 |
(데이터분석) pandas DataFrame 인덱싱 문법 정리 (0) | 2023.06.06 |