[플레이데이터 빅데이터 부트캠프]R 프로그래밍 - 환경 구축

R 프로그래밍

통계 분석 및 시각화에 파이썬보다 좀 더 편리한 인터페이스를 제공한다.

R 프로그래밍 환경 구축

R studio IDE를 설치한다.

콘솔창보다는 스크립트 창에서 코드를 입력하여 실행하면 편하다.

실행을 하려면 블록을 잡고 ctrl + Enter를 하면 된다.

a <- 5
b <- 4
z <- a +b

print(z)
[1] 9

자주 쓰는 함수

ls() : 지금 보고 있는 변수의 상태를 보여준다.

ls.str() : 이름 이외의 정보를 알고 싶을 때 사용하는 함수이다.

rm(list=ls()) : 모든 변수 삭제

배열

Q <- c("three", "blind", "mice")
print(Q)
[1] "three" "blind" "mice"

저장할 때 데이터 타입을 통일해서 저장해줘야 한다.

m:n 표현식

1:5
[1] 1 2 3 4 5

9:0
[1] 9 8  7 6 5 4 3 2 1 0

seq(from=1, to=5, by=2)
[1] 1 3 5

rep(1, times=5)
[1]1 1 1 1 1 

s <-as.Date("2015-01-01")
e <-as.Date("2015-01-15")

seq(s, e, 1)
[1] "2015-01-01" "2015-01-02" "2015-01-03"
[4] "2015-01-04" "2015-01-05" "2015-01-06"
[7] "2015-01-07" "2015-01-08" "2015-01-09"
[10] "2015-01-10" "2015-01-11" "2015-01-12"
[13] "2015-01-13" "2015-01-14" "2015-01-15"

seq(from=s, by=1, length.out=7)
[1] "2015-01-01" "2015-01-02" "2015-01-03"
[4] "2015-01-04" "2015-01-05" "2015-01-06"
[7] "2015-01-07"

비교연산자

R에서도 비교연산자를 제공한다.

v <- c(3, pi, 4)
w <- c(pi, pi, pi)

any(v==pi)
[1]True
all(v==pi)
[1]FALSE

any는 or, all는 and의 개념이다.

인덱싱

R프로그래밍에서도 인덱싱을 제공한다. 파이썬과는 다르게 첫번째 인덱스는 0이 아니라 1로 시작한다.

그리고 -1 인덱싱은 파이썬과 다르게 첫 번째 인덱스를 지워서 출력해 준다.

fib <- c(0, 1, 1, 2, 3, 5, 8, 13, 21, 34)
fib[-1]
[1] 1 1 2 3 5 8 13 21 34

fib <- c(0, 1, 1, 2, 3, 5, 8, 13, 21, 34)
fib[-1:-3]
[1] 2  3  5  8 13 21 34

 

여러 개의 인덱스를 지우고 싶으면 음수의 인덱스로 슬라이싱을 사용하면 된다.

함수 생성

cv <- function(x) sd(x)/mean(x)
x <- c(1:10)

cv(x)
[1] 0.5504819

cv(1:10)
[1] 0.5504819

gcd <- function(a, b){
  if (b==0) return(a)
  else return(gcd(b,a%%b))
}

gcd(8,2)
[1] 2

패키지

library() : 컴퓨터에 설치된 라이브러리 목록을 알려준다.

package.installed 함수를 사용하면 설치 된 목록을 확인할 수 있다.
search() : 메모리에 로딩된 함수 확인

 [1] ".GlobalEnv"        "tools:rstudio"    
 [3] "package:stats"     "package:graphics" 
 [5] "package:grDevices" "package:utils"    
 [7] "package:datasets"  "package:methods"  
 [9] "Autoloads"         "package:base"