※ 데이터 유형 총정리
문자형 | CHAR VARCHAR LONG CLOB |
숫자형 | INT BIGINT(숫자의 크기가 너무 클때) NUMERIC FLOAT DOUBLE |
날짜형 | DATE TIMESTAMP |
참/거짓 | BOOLEAN |
※ 데이터 유형 변환 방법
※ 데이터 가공 문법 총정리
특정 문자열만 잘라내기 | left right substring |
문자열 합치기 | A || B concat(A,B) |
조건별로 그룹핑하기 | case when ~ else ~ end (else부분은 필수는 아니다) |
null값 치환하기 | coalesce(컬럼명, ~~~) nvl(컬럼명, ~~~) |
그 외)
특정 문자열 자르기 : trim, ltrim, rtrim
특정 문자열을 임의의 값으로 변경하기 : replace
대문자로 변경 : upper
소문자로 변경 : lower
문자열의 길이 반환 : length, len
※ 숫자형 데이터 가공하기
반올림 올림 내림 |
round ceiling trunc |
절대값 반환 | abs |
null값 치환하기 | coalesce(컬럼명, 0) nvl(컬럼명, 0) |
※ 날짜 데이터 가공하기 (외우기보다 익숙해지기 / sql프로그램마다 다를 수 있다)
날짜 더하기 / 빼기 | 날짜 + / - interval '1 day' |
날짜간 빼기 | datediff('day', 날짜, 날짜) |
날짜에서 특정 월/주/분기 등 추출하기 | date_part('month',날짜) to_char(날짜,'mm') |
현재 날짜의 월1일, 분기1일, 주 시작일 구하기 | date_trunc('month', now()) date_trunc('quarter', now()) date_trunc('week', now()) |
※ 주문 데이터 최종 리뷰
1. 현황파악
- 잘 팔리는 카테고리는 무엇인가? TOP3 카테고리의 대략적인 매출비중은?
- 성/연령별 매출액은? vs 인당 매출액이 높은 성/연령은?
- 남성이 주로 구매하는 아이템은?
- 어떤 컨셉의 아이템이 가장 잘 팔리고 있는가?
- 할인율이 높은 카테고리는? 마진율이 높은/낮은 카테고리는?
- 인당 구매수량이 높은 카테고리는?
2. 아직까지 못한 분석 (태블로 / 파이썬으로 하는 것이 효율적)
- 성장률 계산하기 (비추천)
- 구매비중 계산하기 (비추천)
- 매출액이 높은 순으로 랭킹 매기기 (비추천)
- 하룻동안 상품을 두개 이상 주문한 고객이 주문한 상품은 주로 무엇인가? (서브쿼리** , 어렵지만 배우면 정말 좋다)
SQL로 굳이 하지 않고, SQL로 데이터를 다듬고 가공하여 태블로나 파이썬으로 예측모델이나 분석모델을 만드는 편이다.
'SQL' 카테고리의 다른 글
SQL 앞으로의 학습방법 (0) | 2023.03.07 |
---|---|
SQL 심화이론 (1) | 2023.03.07 |
SQL 실습 ③ 데이터 가공하기 (0) | 2023.03.07 |
SQL Join의 유형 / 주의사항 (0) | 2023.03.02 |
SQL 실습 ② 주문 데이터 분석 (join 이용) (0) | 2023.03.02 |