[Fast campus] Data Science with R 1기 - 이부일 강사님
R 공부하면서 배운 내용 복습 겸 정리하는 곳입니다.
외부 데이터 : txt, csv, excel(xls, xlsx)
1. 텍스트 데이터 : txt
(1) 구분자(Separator) : 공백 하나(blank, white space)
1 2 3 | 데이터명 = read.table(file = "파일위치/파일명.txt", header = TRUE, sep = " " | cs |
(2) 구분자(Separator) : comma(,)
1 2 3 | 데이터명 = read.table(file = "파일위치/파일명.txt", header = TRUE, sep = "," | cs |
(3) 구분자(Separator) : 탭(tab)
1 2 3 | 데이터명 = read.table(file = "파일위치/파일명.txt", header = TRUE, sep = "\t" | cs |
2. CSV(Comma Separated Value)
# 엑셀의 특수한 형태
1 2 3 | 데이터명 = read.table(file = "파일위치/파일명.txt", header = TRUE, sep = "\t" | cs |
3. 엑셀 : xls, xlsx
# R의 기본 기능에서는 못 읽어 옴
# 추가 기능(패키지(Package))을 설치 - install.packages("패키지명")
# 패키지 로딩하기, 구동하기 - library(패키지명)
1 2 3 4 5 6 | > install.packages("readxl") package ‘readxl’ successfully unpacked and MD5 sums checked The downloaded binary packages are in C:\Users\JungChul\AppData\Local\Temp\RtmpG8Gy4u\downloaded_packages > library(readxl) | cs |
# 패키지 설치 명령어 후 successfully 메시지가 나오면 설치 완료
# 패키지는 항상 코드 가장 위( 다른 pc에서 실행 할 수도 있으니 install.packages명령어도 같이 적어두기 )
# 패키지 내 함수를 사용할 때는 '패키지명::함수' 형태로 사용하자
1 2 3 | 데이터명 = readxl::read_excel(path="파일위치/파일명.xlsx", sheet=index or "시트명", col_names=TRUE) | cs |
'Programming > R' 카테고리의 다른 글
[Fast campus] 07. 데이터 핸들링 2 (0) | 2017.07.20 |
---|---|
[Fast campus] 06. 데이터 핸들링 1 (0) | 2017.07.20 |
[Fast campus] 04. 데이터의 유형(Type of Data) - 배열(Array), 데이터 프레임(Data.Frame), 리스트(List) (0) | 2017.07.19 |
[Fast campus] 03. 데이터의 유형(Type of Data) - 요인(Factor), 행렬(Matrix) (0) | 2017.07.19 |
[Fast campus] 02. 데이터의 유형(Type of Data) - 벡터(vector) (0) | 2017.07.19 |