[플레이데이터 빅데이터 부트캠프]R 프로그래밍 - 그래프

산점도

  • 주어진 데이터를 점으로 표시해 흩뿌리듯이 시각화한 그래프이다.
  • 실제 값들을 한눈에 살펴보기에 유용하다.
plot(Orange$age, orange$circumference, xlab = "Orange Tree Age", ylab = "Orange Tree Circumference, main
ce", main = "Orange", pch = 20)

plot(Orange$age, orange$circumference, xlab = "Orange Tree Age", ylab = "Orange Tree Circumference, main
ce", main = "Orange", pch = "+")

위의 그래프는 Orange 데이터의 나이와 둘레를 산점도로 표현한 그래프이다.

여기서 main은 그래프의 제목, pch는 점의 모양을 설정할 수 있다. (숫자 지정 : 미리 지정된 심볼 사용)

꺾은선 그래프

plot(cars)

lines(lowess(cars))

 

오른쪽 그림은 car 데이터에 데이터를 설명하는 추세선(회귀분석)을 꺽은 선 그래프로 그린 모습이다.

박스 플롯

  • 상자그림을 그리며, 데이터의 분포를 보여준다.
  • 그래프의 점들은 이상치에 해당한다.
boxplot(cars$dist)

 

히스토그램

값의 범위를 빈도로 표현한 히스토그램을 그려준다.

hist(cars$dist)

밀도 그래프

총 넓이를 1로 잡고, 데이터의 밀도를 추정하는 그래프이다.

plot(density(cars$dist))

파이 그래프

데이터의 비율을 원의 모양으로 표현해 준다.

예제) 2019년 스마트폰 판매율

slices <- c(19.2, 15.7, 11.9, 7.9, 7.3, 37.9)
name <- c("Samsung", "Huawei", "Apple", "OPPO", "Vivo", "Other")
pie(slices, labels = name, main="Smartphone sales rate in 2019")