일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 코드잇 TIL
- 머신러닝
- for반복문
- 윈도우함수
- 행렬
- 코딩독학
- 선형회귀
- sql연습문제
- 영국석사
- 파이썬
- 오늘도코드잇
- numpy
- 판다스
- 나혼자코딩
- 코드잇
- 코딩
- Seaborn
- matplotlib
- 로지스틱회귀
- CSS
- 런던
- 코딩공부
- 유학생
- HTML
- 다항회귀
- 결정트리
- 경사하강법
- 데이터분석
- SQL
- 코드잇TIL
- Today
- Total
목록전체 글 (184)
영국 척척석사 유학생 일기장👩🏻🎓

1. With기존 테이블에서 테이블을 "의사 생성" 하고 메인 쿼리 상단에 임시 테이블을 시각적으로 범위를 정하려는 경우WITH subqurery_name (column_name1, ...) AS (SELECT ..._)SELECT ... 2. Nested임시 테이블이 더 큰 쿼리 내에서 필터 역할을 하도록 할 때 사용WHERE 절 안에 위치SELECT s.s_id, s.s_name, g.final_gradeFROM student s, grades gWHERE s.s_id = g.s_id IN (SELECT final_grade FROM grades g WHERE final_grade > 3.7 );3. Inlinewith와 동일한 방식으로 사용되나 메인 쿼리 위에 있는 임시 테이블 대..

1) CASECASE 문은 항상 SELECT 절에 써야 함CASE는 WHERE, THEN, END 구성요소를 포함해야함ELSE는 다른 CASE 조건을 충족하지 않는 경우를 위한 선택적 구성 요소WHEN 사이에 조건 연산자 (WHERE) 를 사용하여 조건문 만들 수 있음 (AND, OR 사용 가능)예시 SELECT id, account_id, occurred_at, channel, CASE WHEN channel = 'facebook' OR channel = 'direct' THEN 'yes'ELSE 'no' END AS is_facebookFROM web_eventsORDER BY occurred_at SELECT account_id, occurred_at, total,CASE WHEN total > 5..

1) DATE_TRUNC날짜, 시간 열의 특정 부분으로 날짜를 자를 수 있습니다.RESULTINPUT2024-04-01 12:15:01DATE_TRUNC('second', 2024-04-01 12:15:01)2024-04-01 00:00:00DATE_TRUNC('day', 2024-04-01 12:15:01)2024-04-01 00:00:00DATE_TRUNC('month', 2024-04-01 12:15:01)2024-01-01 00:00:00DATE_TRUNC('year', 2024-04-01 12:15:01) 2) DATE_PART하루 중 특정 부분만 빼내고 싶은 경우dow : day of week, 0(일요일)~6(토요일) 사이의 값을 반환RESULTINPUT1DATE_PART('second', ..

1) HAVING집계된 쿼리를 조건에 의해 필터링 할 때 씁니다.WHERE을 쓰지 않은 이유는 WHERE 절은 집계 열에 대한 필터링을 허용하지 않기 때문입니다.이 때 HAVING 을 씁니다.SELECT account_id, SUM(total_amt_usd) sum_total_amt_usdFROM ordersGROUP BY 1HAVING SUM(total_amt_usd) >= 250000 2) 연습문제sales reps 중 자신이 관리하는 계정이 6개 이상인 사람은 몇 명입니까? 34명 21개 이상의 주문이 있는 accounts는 몇 개입니까? 120개 주문이 가장 많은 계정은 어디입니까? Leucadia National 모든 주문에서 총 30,000 USD 초과를 지출한 계정은 어디입니까? 가장 많이..

1) DISTINCTDISTINCT문은 중복된 데이터를 제거하고 데이터를 조회할 때 사용합니다.DISTINCT문을 사용하면 테이블에 중복되는 데이터를 한번만 출력하여 고유 값만을 추출합니다.일부 열을 기준으로 그룹화하고 싶지만 집계를 포함하지 않을 때 GROUP BY 대신 사용합니다.SELECT 문에서 사용되며 SELECT 문에 작성된 모든 열에 대해 고유한 행 제공합니다.SELECT DISTINCT column1, column2, column3FROM table1;아래는 잘못된 예시입니다.SELECT DISTINCT column1, DISTINCT column2, DISTINCT column3FROM table1;결과 예시 2) 연습문제DISTINCT를 사용하여 둘 이상의 지역과 연결된 계정이 있는..

(데이터분석) 파이썬 BeautifulSoup으로 웹 페이지 스크래핑하기웹사이트에서 데이터에 액세스하기 어려울때, 코드를 사용하는 웹 스크래핑을 통해서 데이터를 추출해보겠습니다. 웹사이트 데이터는 태그를 사용해 페이지의 구조를 지정하는 하이퍼텍스트life-of-nomad.tistory.com 저번 글에서 알아본 API, 직접 다운로드, 스크래핑을 통해 병원 건물 데이터를 추출하고 구문을 분석해보겠습니다. 먼저 필요한 라이브러리를 불러오겠습니다. 1) API를 통해 추출하기이 데이터를 통해 병원은 Alameda에 있고 시설 이름은 Alameda Hospital, 건물 번호는 BLD-01278임을 알 수 있습니다. 2) csv 파일 직접 다운로드를 통해 추출하기 3) 스크래핑을 통해 추출하기

웹사이트에서 데이터에 액세스하기 어려울때, 코드를 사용하는 웹 스크래핑을 통해서 데이터를 추출해보겠습니다. 웹사이트 데이터는 태그를 사용해 페이지의 구조를 지정하는 하이퍼텍스트 마크업 언어(HyperText Markup Language, HTML)로 작성됩니다. 구문 분석기를 사용하여 액세스할 수 있습니다. BeautifulSoup를 사용하면 더욱 편리합니다.* BeautifulSoup : 파이썬 언어로 작성된 HTML 구문 분석기 1) BeautifulSoup 라이브러리 불러오기 2) language_of_flowers.html 을 fp라는 파일 객체로 열기3) Beautiful 생성자에 전달하고 그 결과를 flower_soup 변수에 할당하기 4) flower_soup 결과 확인하기 5) prett..

1) GROUP BY 여러 열로 그룹화하기여러 segment에 걸쳐 집계하는데 유용열 이름의 순서는 중요하지 않음. 결과는 상관없이 동일함. GROUP BY절에서 동일 쿼리를 실행하고 순서를 반대로 해도 동일 결과를 얻을 수 있음주의 : 집계에 포함되지 않은 모든 열은 GROUP BY 문에 표시되어야 함. 2) 연습문제각 계정에 대해 주문에서 구매한 각 용지 유형의 평균 금액을 결정합니다. 결과에는 계정 name에 대한 열과 각 계정의 각 용지 유형에 대해 구매한 평균 수량에 대한 열이 있어야 합니다.각 계정에 대해 각 용지 유형에 대해 주문당 평균 지출 금액을 결정합니다. 결과에는 4개의 열이 있어야 합니다. 하나는 계정 name에 대한 열이고 다른 하나는 각 용지 유형에 지출된 평균 금액입니다.각 s..

1) GROUP BY데이터의 하위 세트 내에서 데이터를 집계하는데 사용 가능위의 schema에서는 다른 계정, 다른 지역 또는 다른 영업 담당자에 대한 그룹화aggregator 내에 있지 않은 SELECT 문의 모든 열은 GROUP BY 열에 있어야 함GROUP BY 는 항상 WHERE 과 ORDER BY 사이에 있음ORDER BY는 스프레드시트 소프트웨어에서 SORT처럼 작동오류발생 코드 예GROUP BY로 바르게 고친 예 2) 연습문제가장 먼저 주문한 account(이름)는? 해결책에는 주문의 account name과 date가 있어야 합니다.각 계정의 총 판매액을 usd로 찾습니다. usd 및 회사 name의 각 회사 주문에 대한 총 매출이라는 두 개의 열을 포함해야 합니다. 어떤 channel을 ..

1) MIN, MAX각 열의 최솟값, 최댓값숫자가 아닌 열에도 사용 가능 (알파벳에서 가장 낮은(높은) 숫자, 가장 빠른(늦은) 날짜)2) AVG데이터의 평균 (열의 모든값의 합계)/(열의 값의 수)분자와 분모 모두에서 NULL값을 무시NULL을 0으로 계산하려면 SUM및 COUNT를 사용해야 함3) 연습문제가장 먼저 주문한 것은 언제입니까? 날짜만 반환하면 됩니다.SELECT MIN(occurred_at)FROM orders;집계 함수를 사용하지 않고 질문 1과 동일한 쿼리를 수행해 보십시오.SELECT occurred_atFROM ordersORDER BY occurred_atLIMIT 1;가장 최근(최신) web_event는 언제 발생했습니까?SELECT MAX(occurred_at)FROM web..

이 글에서는 지난 글에서 저장한 폴더 안에 있는 영화 평론 텍스트파일을 읽어보겠습니다 파이썬의 glob라이브러리를 사용해서 각 파일을 한 줄씩 읽어들여서 파일의 제목, URL, 본문을 추출하고 Pandas DataFrame에 저장해보겠습니다. (데이터분석) 파이썬의 requests 라이브러리 이용하여 파일 다운로드하기requests 라이브러리로 파일 다운로드하기1) requrests 와 os 불러오기 2) 다운로드한 파일을 저장할 디렉터리 만들기os.path.exist : 파일 경로가 존재하는지 확인if not : 존재하지 않을 때만 디렉터리 만life-of-nomad.tistory.com 지난 글에서 저장한 디렉터리를 먼저 보겠습니다.각 txt 파일을 더블 클릭해서 열어보면 아래와 같습니다.첫번째 줄..

requests 라이브러리로 파일 다운로드하기1) requrests 와 os 불러오기 2) 다운로드한 파일을 저장할 디렉터리 만들기os.path.exist : 파일 경로가 존재하는지 확인if not : 존재하지 않을 때만 디렉터리 만들기 3) url 리스트 만들기 4) requestsrequests.get(url)로 HTTP GET 요청 생성하기raise_for_statur 함수 : GET 요청에 오류가 발생했을 때 예외가 발생하도록 설정하기os.path.join : 콘텐츠를 다운로드할 파일 경로 구성하기 (folder_name과 url결합해서 이름으로 지정 위의 예시에서는 /로 구분된 것중 끝에서 첫번째 요소니깐 ebert_review_2017/1-the-wizard-of-oz-1939-film.tx..