[제로베이스 데이터 분석 취업 스쿨]Day17 SQL 분석1

BI(Business Intelligence)

비즈니스 인텔리전스는 조직이 좀 더 데이터 기반의 의사 결정을 하돌고 지원하는 비즈니스 분석, 데이터 마이닝, 데이터 시각화, 데이터 도구, 인프라, 모범 사례가 모두 포함된다. 

 

 

데이터셋

시장 트랜드 조사에 유용한 통계청 홈페이지에 들어간다.

온라인 쇼핑 동향 파악 

우리는 통계청의 '온라인쇼핑몰 운영형태별 상품군별거래액'이란 데이터를 다운 받아 실습하였다.

Python Pandas를 사용한 데이터프레임 재구조화

pd.melt()

가로 방향 데이터셋을 세로 방향으로 세세하게 보여 준다.

pd.pivot_table()

세로 방향 데이터셋을 가로 방향으로 집계해준다고 보면 된다. 

집계하는 칼럼은 반드시 정수형이어야 한다. 정수형이 아니면 정수형으로 전처리한 후, pivot_table화 한다. 

이제 칼럼이 될 곳에 '날짜'를 넣어준다. 

평균, 중간, 합계 등 여러가지 집계함수를 사용할 수 있다. 

 

람다함수

람다함수와 어플라이 함수를 사용하여 전처리한다. 

람다함수를 사용하여 전처리하면 함수를 정의할 필요 없이 바로 실행시킬 수 있다.

 

최종 전처리 완료