이커머스 데이터 분석과 지표 구글 BigQuery Data Warehouse 데이터셋 소개 캐글 Brizilian E-Cpmmerce Public Dataset by Olist - 약 10만 건의 실제 브라질 이커머스 주문 데이터 - 주문 외에도 지리정보, 리뷰 등 다양한 데이터를 포함 사용하기 기본적으로 SQL 문법을 사용한다. 먼저 GCP에 접속하여, Project를 만든다. 그리고 쿼리 탐색 실행한다 . 데이터셋 올리기 이커머스 매출 분석 무엇을 보면 되나? ->큰 단위 먼저 살피고 작은 단위를 살피면 좋다. 이커머스 주문 건 수 건 당 주문 금액 테이블 정보와 쿼리 실전 테이블 선택 -> 쿼리 -> 새 탭에서 열기 총매출 그리고 주문 건수 계산 테이블 정보와 실습 쿼리 3 총 매출, 주문건수 ->..
태블로로 만드는 대시보드 대시보드란? 여러 차트를 한 판에 나타내는 것을 말한다. 대시보드를 만들 때 주의할 점 1. 차트를 이해하기 위해 필요한 정보가 모두 들어있는지? 기간, 단위, 축 등 2. 반대로 차트 내에 불필요한 내용은 없는지? 3.시각적 요소들이 충분히 일반적인가? 중요할수록 상단에 굵게 개시한다. 대시 보드 위와 같이 만들어 놓은 여러 시트를 바탕으로 대시보드를 만들 수 있다. 필터 여러 가지 데이터를 필터링해서 데이터를 살펴볼 수 있다. 인터랙티브 대시보드 대시보드에서 상호작용이 가능하다. 대시보드 -> 동작 -> 필터 추가 하이라이트 선택한 값을 강조한다. (하이라이트 표시) 대시보드 - 동작 추가에서 하이라이트 추가 관계와 조인 여러개의 데이터셋을 다룰 때 사용된다. 관계 조인 없이..
단순 반복 업무 줄이기 import os 운영체제와 상호작용하는 라이브러리다. os.getcwd() 워킹 디렉토리를 보여준다. 워킹 디렉토리 아래의 파일들을 모두 불러온다. Tableau 환경설정 우선 Tableau를 구글 드라이브에 연결한다. Tableau 통합 패키지 문서로 저장하면 데이터까지 모두 저장할 수 있다. 차원과 측정값 회색선 기준으로 위쪽에 있는 데이터를 차원이라 하고 아래쪽에 있는 데이터들을 측정값이라고 한다. 차원과 측정값 차원 : 정성적 값 예를 들면 이름, 날짜 지리적 데이터 등을 포함한다. 측정값 : 측정할 수 있는 정략적 수치 값을 포함한다. 측정값을 집계할 수 있다. 연속형과 불연속형 데이터 녹색 측정값일 때는 연속형 데이터이고, 측정값이 파란색일 때는 불연속형 데이터이다. ..
BI(Business Intelligence) 비즈니스 인텔리전스는 조직이 좀 더 데이터 기반의 의사 결정을 하돌고 지원하는 비즈니스 분석, 데이터 마이닝, 데이터 시각화, 데이터 도구, 인프라, 모범 사례가 모두 포함된다. 데이터셋 시장 트랜드 조사에 유용한 통계청 홈페이지에 들어간다. 온라인 쇼핑 동향 파악 우리는 통계청의 '온라인쇼핑몰 운영형태별 상품군별거래액'이란 데이터를 다운 받아 실습하였다. Python Pandas를 사용한 데이터프레임 재구조화 pd.melt() 가로 방향 데이터셋을 세로 방향으로 세세하게 보여 준다. pd.pivot_table() 세로 방향 데이터셋을 가로 방향으로 집계해준다고 보면 된다. 집계하는 칼럼은 반드시 정수형이어야 한다. 정수형이 아니면 정수형으로 전처리한 후, ..
Git Log Commit history를 볼 수 있다. commit id, 저자, 시간, 메시지 등을 확인할 수 있다. git Log -2 두 개만 볼 수 있다. git log -p 변경사항 확인 git log --oneline 한 줄로 출력 git log --author= 사용자 정보로 탐색 git log -S 파일 변경내용으로 검색 git log --grep git log --grep Remote Respository push, pull을 통하여 Local Repository에서 동기화 할 수 있다. 1. git init으로 로컬 저장소를 지정한다. 2. 비어 있는 repository 생성 readme.md와 gitignore 파일 제외, repository 주소 복사 및 토큰 수령 git remo..
Git hostory VCS(Version Control System) 형상 관리 시스템이라고도 한다. 하나의 프로젝트를 여러명이 동시에 개발해야 한다. 개발 중 문제가 발생하면, 문제의 전후 상황을 파악하여 특정 시점의 버전으로 돌아갈 수 있어야 한다. 버전별로 소스가 관리되어야 한다. 요즘 기업들은 대부분 Git을 사용하고 있다. www.git-scm.com Git의 버전관리 파일의 변경사항이 없는 경우, 파일을 새로 저장하지 않고, 스냅샷을 저장한다. git 환경 설정 autocrf True로 설정 git config --system core.autocrlf true ->맥과 윈도우즈간의 충돌을 막을 수 있다. editor 이름을 code로 설정 git config --global core.edit..