[플레이데이터 빅데이터 부트캠프]R 프로그래밍 - 변수, 자료형

변수, 자료형

R에서는 배열을 벡터라고 부른다.

벡터 연산자

%in% : 벡터 x에 value가 저장되어 있는지 판단

"x" %in% c("x", "y", "z")
[1] TRUE

"W" %in% c("x", "y", "z")
[1] FALSE

rep(x, times, each)

rep(1:2, times = 4)
[1] 1 2 1 2 1 2 1 2  

rep(1:2, each = 4)
[1] 1 1 1 1 2 2 2 2 

rep(1:2. each = 4, times = 2)
[1] 1 1 1 1 2 2 2 2 1 1 1 1 2 2 2 2

Factor

팩터은 범주형 데이터를 표현하기 위한 데이터 타입이다.

f <- factor("t", c("s", "t", "e"))
f

[1] t
Levels: s t e

levels는 factor 안에 어떠한 요소가 있는지 출력해준다.

리스트

파이썬에서 딕셔너리와 같은 자료형이다.

R에서는 배열(리스트)를 벡터라고 부른다.

(a <- list(names = "Data", num = 100))
$names
[1] "Data"

$num
[1] 100

> a$names
[1] "Data"

> a$num
[1] 100

a라는 리스트를 괄호를 쳐주면 바로 입력을 거치지 않고 바로 실행시켜준다.

행렬

> matrix(c(1:9),nrow=3,byrow=TRUE)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9




>matrix(c(1:9),nrow=3,byrow=FALSE)
     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9

byrow 파라미터를 사용하여, 행 우선으로 행렬 생성할 수 있다.

행렬 연산

행렬의 곱셈

> a <- matrix(c(1:9),nrow=3,byrow=TRUE)
> a%*%a
     [,1] [,2] [,3]
[1,]   30   36   42
[2,]   66   81   96
[3,]  102  126  150