[Fast campus] Data Science with R 1기 - 이부일 강사님
R 공부하면서 배운 내용 복습 겸 정리하는 곳입니다.
IV. 배열(Array)
# 다차원
# vector, 행렬의 확장
# 벡터의 특징( Recycling Rule, Vectorization ) 그대로 적용됨
# array(vector, dim=)
1 2 | > array(1:10, dim=10) [1] 1 2 3 4 5 6 7 8 9 10 | cs |
# dim에 1개의 숫자
# 1차원 형태를 지닌 벡터의 결과
1 2 3 4 5 | > array(1:10, dim=3:4) [,1] [,2] [,3] [,4] [1,] 1 4 7 10 [2,] 2 5 8 1 [3,] 3 6 9 2 | cs |
# dim에 3,4 => 2개의 숫자
# 2차원 형태를 지닌 행렬의 결과
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | > array(1:10, dim=c(3,4,2)) , , 1 [,1] [,2] [,3] [,4] [1,] 1 4 7 10 [2,] 2 5 8 1 [3,] 3 6 9 2 , , 2 [,1] [,2] [,3] [,4] [1,] 3 6 9 2 [2,] 4 7 10 3 [3,] 5 8 1 4 | cs |
# dim에 숫자 3,4,2 => 3개의 숫자
# 3행 4열 2높이 => 3차원
V. 데이터 프레임(Data.Frame)
# 행, 열로 구성. 2차원
# 여러 개의 데이터 유형을 가질 수 있음
# 단, 하나의 열은 하나의 데이터 유형만 가짐
# data.frame(벡터1, 벡터2, 행렬, ...)
1 2 3 4 5 6 7 8 9 10 11 | > id = 1:5 > gender = c("m", "m", "m", "f", "m") > address = c("구파발", "강동", "압구정", "수원", "용인") > survey = data.frame(id, gender, address) > survey id gender address 1 1 m 구파발 2 2 m 강동 3 3 m 압구정 4 4 f 수원 5 5 m 용인 | cs |
VI. 리스트(List)
# 분석한 결과를 저장할 때에 많이 사용하는 형태
# 가장 유연한 데이터 형태
# 리스트의 원소로 vector, factor, matrix, array, data.frame, list를 가질 수 있다.
# list(vector, factor, matrix, array, data.frame, list, ...)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 | > v1 = 1:10 > v2 = 1:3 > v3 = c("ch", "nu", "lo") > v4 = c(TRUE, FALSE) > m1 = cbind(v1, v2) > result = list(v1, v2, v3, v4, m1, survey) > result [[1]] [1] 1 2 3 4 5 6 7 8 9 10 [[2]] [1] 1 2 3 [[3]] [1] "ch" "nu" "lo" [[4]] [1] TRUE FALSE [[5]] v1 v2 [1,] 1 1 [2,] 2 2 [3,] 3 3 [4,] 4 1 [5,] 5 2 [6,] 6 3 [7,] 7 1 [8,] 8 2 [9,] 9 3 [10,] 10 1 [[6]] id gender address 1 1 m 구파발 2 2 m 강동 3 3 m 압구정 4 4 f 수원 5 5 m 용인 | cs |
리스트의 슬라이싱
# 리스트의 슬라이싱은 [ ] , [[ ]]
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | > a1 = result[1] > a2 = result[[1]] > a1 [[1]] [1] 1 2 3 4 5 6 7 8 9 10 > a2 [1] 1 2 3 4 5 6 7 8 9 10 > b1 = result[4] > b2 = result[[4]] > b1 [[1]] [1] TRUE FALSE > b2 [1] TRUE FALSE | cs |
# 대괄호 1개 사용 : 결과는 list
# 대괄호 2개 사용 : numeric, character, logical, list로 나타남.
'Programming > R' 카테고리의 다른 글
[Fast campus] 06. 데이터 핸들링 1 (0) | 2017.07.20 |
---|---|
[Fast campus] 05. 외부 데이터 읽어오기 (0) | 2017.07.19 |
[Fast campus] 03. 데이터의 유형(Type of Data) - 요인(Factor), 행렬(Matrix) (0) | 2017.07.19 |
[Fast campus] 02. 데이터의 유형(Type of Data) - 벡터(vector) (0) | 2017.07.19 |
[Fast campus] 01. Basic (0) | 2017.07.19 |