[플레이데이터 빅데이터 부트캠프]R 프로그래밍

빅데이터 분석에는 크게 분류, 군집, 회귀, 시계열 분석, 상관관계 분석 등 5개가 있다.

빅데이터 분석을 위한 데이터 조작을 실습해 보자.

setwd("C:/Users/Playdata/Desktop/Playdata")

(x<-read.csv("score.csv",header=T)

> rbind(c(1,3,5,6),c(2,4,5,8))
     [,1] [,2] [,3] [,4]
[1,]    1    3    5    6
[2,]    2    4    5    8

> cbind(c(1,3,5,6),c(2,4,5,8))
     [,1] [,2]
[1,]    1    2
[2,]    3    4
[3,]    5    5
[4,]    6    8

> x=matrix(1:10, ncol=2)
> 
> x
     [,1] [,2]
[1,]    1    6
[2,]    2    7
[3,]    3    8
[4,]    4    9
[5,]    5   10

> apply(x, 1 ,sum)
[1]  7  9 11 13 15

> apply(x, 2, sum)
[1] 15 40

여기서 1은 행, 2는 열을 의미한다.

> lapply(mtcars[, 1:4], mean)
$mpg
[1] 20.09062

$cyl
[1] 6.1875

$disp
[1] 230.7219

$hp
[1] 146.6875

1에서 4열까지의 피쳐들의 평균값을 반환해 주었다.

>sapply mtcars[,1:4],mean)
mpg	       cyl		  disp	         hp
20.09062       6.18750        230.72188    146.68750

tapply(1:15, rep(1,15),sum)
1
120

tapply(1:15, 1:15 %% 2 ==0 ,sum)
FALSE  TRUE 
   64    56

마지막 코드는 홀수와 짝수를 그룹별로 묶어서 계산한 값을 나타내고 있다.

> quantile(mtcars$mpg)
    0%    25%    50%    75%   100% 
10.400 15.425 19.200 22.800 33.900

[플레이데이터 빅데이터 부트캠프]R 프로그래밍 - 그래프 (0)	2022.09.14
[플레이데이터 빅데이터 부트캠프]R 프로그래밍 - 데이터조작(2) (0)	2022.09.14
[플레이데이터 빅데이터 부트캠프]R 프로그래밍 - 조건문 반복문 함수 (0)	2022.09.13
[플레이데이터 빅데이터 부트캠프]R 프로그래밍 - 변수, 자료형 (1)	2022.09.13
[플레이데이터 빅데이터 부트캠프]R 프로그래밍 - 환경 구축 (0)	2022.09.13

[플레이데이터 빅데이터 부트캠프]R 프로그래밍 - 데이터 조작(1)