[플레이데이터 빅데이터 부트캠프]리눅스 첫 수업
빅데이터의 정의 3V -> Volume, Velocity, Variety 단일 서버에서 다루기 버거울 때, 빅데이터가 되었다고 한다. Hadoop-> 빅데이터는 분산 병렬 처리를 지원한다. 실시간(real time) 모아서 처리(batch 처리) 빅데이터는 일괄 처리를 한다. -> ex)주식, 날씨, Iot(사물 인터넷)환경 IoT의 핵심 기반은 센서이다. 센서로 정보를 수집한다. variety에는 정형 데이터(csv, rdb), 반정형 데이터, 비정형 데이타가 있다. 대표적인 RDBMS는 오라클과 mySQL, MSSQL, mariaDB이 있다. R은 관계형 데이타 모델을 의미한다.(외래키를 사용하여 데이터끼리 연결시켜 놓는다.) 정형화해서 연결 시켜 놓는다. DBMS는 접근성이 좋다. 반정형 데이터 누..
- 플레이데이터 빅데이터 부트캠프 12기/Linux & Hadoop
- · 2022. 8. 16.