지난 포스팅에서 외부 파일을 R로 불러오는 함수에 대해서 알아봤다면, 이번 포스팅에서는 거꾸로 R에서 처리한 데이터 객체를 외부 파일(텍스트)로 저장하는 함수와 분석결과를 외부 파일로 저장하는 함수에 대해서 알아보겠습니다.
(엑셀로 내보내는 것은 유용할 거 같아 시도해봤는데요, rJAVA가 안깔린다면서 에러가 나네요 -,-;)
(1) 데이터 객체를 텍스트 파일로 저장: write.table() |
지난 포스팅에서 외부 파일에서 R로 불러왔던 'dataset_1' 데이터 프레임을 이번에는 거꾸로 'cust_profile.txt'라는 이름으로 밖으로 내보내서 저장을 해보도록 하겠습니다.
> ## 데이터 객체를 외부 텍스트 파일로 저장: write.table() > write.table(dataset_1, "C:/Users/user/Documents/R/cust_profile.txt", + sep = ",", + row.names = FALSE, + quote = FALSE, + append = TRUE, + na = "NA" + ) |
- write.table( 데이터셋 이름, 저장할 경로/저장할 파일 이름...) 순서로 쓰되, 경로에 구분자가 '\'가 아니라 R에서는 '/' 이므로 주의 요망
- sep = "," 또는 " " 또는 ":" 등 데이터 구분자 입력. tab 구분자는 sep = "\t"
- row.names = FALSE 행 이름(번호)가 생략됨. key 값이 별도로 있으면 생략하고, 혹시 key 값을 관리하고 싶은면 TRUE로 옵션 설정
- quote = FALSE 면 변수 이름, 행 이름에 인용부호(" ") 생략. 구분자(sep)를 따로 지정하면 굳이 인용부호 없어도 무방
- append = TRUE 이면 나중에 추가로 동일 파일 이름으로 write.table()함수가 실행될 경우 기존 파일에 덮어쓰기를 하지 않고 계속 이어 붙이기를 함. 덮어쓰기를 하면 기존 파일이 다 날아가버리고 마지막 덮어쓴 이후의 데이터만 남게되어 대략 난감한 상황 발생할 것이므로 append = FALSE 옵션은 조심.
- na = "NA" : 결측값이 있으면 "NA"로 표기. na = "." 이면 결측값을 마침표(.)로 표기.
[R 데이터 객체를 외부 텍스트 파일로 저장하기 전]
[R 데이터 객체를 외부 텍스트 파일로 저장하기 후 (cust_profile.txt 파일 신규 생성)]
(2) 분석 결과를 외부 파일로 저장: cat() |
[ 1~10 숫자형 벡터 x를 외부 텍스트 파일로 저장 ]
> ## 1~10 숫자형 벡터 x 생성 > x <- c(1:10) > mean_x <- mean(x) > sd_x <- sd(x) > z_x <- ((x-mean_x)/sd_x) > > cat( "Data is as follows:", "\n", + x, "\n", + file = "C:/Users/user/Documents/R/data_x.txt", + append = TRUE) |
- 큰따옴표(" ") 안에 텍스트는 그래도 출력됨
- "\n"은 새로운 줄로 바꾸라는 뜻 (키보드 엔터 치라는 뜻)
- 벡터 x 를 입력했더니 아래 처럼 벡터 x가 출력되었음. 벡터 연산도 가능.
- file = "" 파일 저장 경로 & 파일 이름 지정
- append = TRUE 동일 경로 & 파일 이름으로 계속 이어 붙이기 하고 싶을 때 사용
[ x의 평균값을 기존 텍스트 파일에 이어 붙여서 저장 ]
> cat( "Mean of x is", mean_x, "\n", + file = "C:/Users/user/Documents/R/data_x.txt", + append = TRUE) |
[ x의 표준편차를 기존 텍스트 파일에 이어 붙여서 저장 ]
> cat( "Standard Deviation of x is", sd_x, "\n", + "\n", + "\n", + "Z score of x is", z_x, "\n", + file = "C:/Users/user/Documents/R/data_x.txt", + append = TRUE) |
양이 적거나, 한번 하고 말일이면 그냥 console 창 가서 눈으로 분석결과 보고서 직접 타이핑하거나, 아니면 블럭 설정해서 복사 > 붙여넣기 하면 됩니다. 다만, 양이 아주 많거나, 아니면 다수 동일 반복작업이 필요한 경우는 cat() 함수로 프로그래밍을 하는게 노가다를 줄이고 정신 건강에도 좋겠지요?! 알아두면 유용한 함수입니다.
console에 나타나는 모형 적합 결과를 외부 파일로 저장할 때 사용하는 capture.output()은 다음번 포스팅에 소개하도록 하겠습니다.
이번 포스팅이 도움이 되었다면 아래의 '공감 ~♡'를 꾸욱 눌러주세요.^^
'R 분석과 프로그래밍 > R 데이터 전처리' 카테고리의 다른 글
R 데이터 객체 탐색을 위한 함수 str(), head(), dim(), length(), names(), class() (0) | 2015.07.14 |
---|---|
R 분석 결과 외부 파일로 저장하기 : capture.output() (27) | 2015.07.12 |
R 데이터 편집기 edit(), 외부 파일 데이터 불러오기 read.table() (5) | 2015.07.11 |
R Indexing (인덱싱), R 데이터 선택 (23) | 2015.07.09 |
R 데이터 구조 (Data Structure in R) : scala, vector, factor, matrix, array, dataframe, list (19) | 2015.07.09 |