R, Python 분석과 프로그래밍의 친구 (by R Friend)

'r'에 해당되는 글 267건

R Graphics 낮은 수준의 그래프 함수 (1) 제목 및 XY축 라벨 추가 : title()

R 분석과 프로그래밍/R 그래프_시각화 2015. 12. 31. 18:40

지난번 포스팅에서는 R Base Graphics plotting system의

(1) 높은 수준의 그래프 함수 (high level graphic functions)

(2) 그래프 모수를 설정하는 2가지 방법 (2 methods of setting graphic parameters)

(3) 그래프 모수 : 기호(symbol), 선(line) 모양 및 크기

(4) 그래프 모수 : 색깔(color)

(5) 그래프 모수 : 그래프 영역 (plot area, inner margin area, outer margin area, multiple plot layout) 에 대해서 소개하였습니다.

높은 수준의 그래프 함수로 그래프의 골격을 만들수 있고, 그래픽 모수로 기호 모양이나 색, 크기 등을 설정할 수 있는데요, 이것 만으로는 원하는 그래프를 만드는데 부족함이 있습니다. 가령 그래프 제목을 추가하고 싶거나, 선이나 점을 추가하고 싶거나, 문자나 범례를 추가하고 싶다거나, XY축을 변경하고 싶을 때가 있는데요, 이때 추가적인 정보를 입력하기 위해 사용하는 것이 '낮은 수준의 그래프 함수 (Low level graphic functions)'가 되겠습니다.

높은 수준의 그래프 함수로 만약 plot(x, y, type = "n") 으로 하면 그래프 창만 열리고 plot area 안에는 빈 공간만 있게 되는데요, 여기에 낮은 수준의 그래프 함수로 그래프 기호, 선, 점, 범례 등을 추가해나갈 수도 있습니다.

이번 포스팅부터 수차례로 나누어서 낮은 수준의 그래프 함수(Low level graphic functions)에 대해서 차례대로 알아보도록 하겠습니다.

[ 낮은 수준의 그래프 함수 (Low level graphic functions) ]

먼저 (1) 그래프 제목(main/sub title) 및 XY축 라벨(XY axis label) 추가하는 방법으로 title() 함수에 대해서 소개해보겠습니다. title() 함수에 사용하는 옵션으로는 주 제목 main, 부 제목 sub, X축 라벨 xlab, Y축 라벨 ylab 등이 있습니다.

title(main = "main title to the top of plot in a large font",

sub = "sub-title sub at the bottom in a smaller font",

xlab = "x axis label",

ylab = "y axis label")

이전 포스팅에서 소개했던 높은 수준의 그래프 함수, 즉 hist(), boxplot(), barplot(), plot() 등의 함수 안에서도 주 제목, 부 제목, X축 라벨, Y축 라벨을 직접 지정할 수 있는데요, 아래 예가 높은 수준읙 그래프 함수로 그린 그래프입니다.

> ##----------------------------------------------
> ## adding main/sub title, XY axis label
> ##----------------------------------------------
> 
> library(MASS) # to use Cars93 dataframe
> 
> # method (1) high level graphic functions : plot()
> plot(MPG.highway ~ Weight, Cars93, 
+      main = "main title : scatter plot of Weight, MPG.highway", 
+      sub = "sub title : plotting with high level graphic functions", 
+      xlab = "x label : Weight", 
+      ylab = "y label : MPG.highway")

위의 그래프와 똑같은 그래프를 낮은 수준의 그래프 함수를 사용해서 그려보겠습니다. 먼저 높은 수준의 그래프 함수로는 "ann = FALSE" 옵션을 추가해서 기본 뼈대만 그려보겠습니다. 아래 그래프를 보시면 주 제목, 부 제목, X축 라벨, Y축 라벨이 하나도 없음을 알 수 있습니다.

> # tmheod (2) low level graphic functions : title()
> # deleting X and Y labels : ann = FALSE
> plot(MPG.highway ~ Weight, Cars93, ann = FALSE)

위의 기본 뼈대만 있는 그래프에 낮은 수준의 그래프 함수(Low level graphic function)를 사용해서 부가정보를 더해보도록 하겠습니다.

> # adding main title, sub title, x label, y label
> title(main = "main title : scatter plot of Weight, MPG.highway", 
+       sub = "sub title : plotting with low level graphic functions", 
+       xlab = "x label : Weight", 
+       ylab = "y label : MPG.highway")

높은 수준의 그래프 함수에서도 주 제목, 부 제목, XY축 Label 등을 설정할 수 있는데 왜 굳이 낮은 수준의 그래프 함수 title() 을 가지고 추가 정보를 입력하는지 의아할 수도 있겠습니다. 높은 수준의 그래프 함수 중에 부가정보를 입력할 수 없는 그래프 함수도 있으며, R의 장점 중에 하나가 대화형으로 그래프의 부가 정보를 차곡 차곡 쌓아가면서, 눈으로 확인해가면서 그릴 수 있어서 굉장히 직관적으로 탐색적 데이터 분석을 할 수 있다는 점입니다.

참고로, 지난번 포스팅에서 소개한 그래프 모수 (graphics parameters) 중에서 기호의 크기를 설정하는 "cex.main = ", "cex.sub = ", "cex.lab = " 옵션을 사용해서 주 제목, 부 제목, XY축 Label의 크기를 변경해보겠습니다.

> # modification of font size : cex.main, cex.sub, cex.lab 
> 
> # deleting X and Y labels : ann = FALSE
> plot(MPG.highway ~ Weight, Cars93, ann = FALSE) 
> 
> # adding main title, sub title, x label, y label
> title(main = "main title with cex 2.2", 
+       sub = "sub title with cex 1.5", 
+       xlab = "x label with cex 1", 
+       ylab = "y label with cex 1", 
+       cex.main = 2.2, # main title size
+       cex.sub = 1.5, # sub title size
+       cex.lab = 1) # x and y label size

다음 포스팅에서는 낮은 수준의 그래프 함수 - (2) XY축 형태 변환 : axis(side, ...) 에 대해서 알아보도록 하겠습니다.

많은 도움이 되었기를 바랍니다.

이번 포스팅이 도움이 되었다면 아래의 '공감 ~♡' 단추를 꾸욱 눌러주세요.^^

728x90

저작자표시 비영리 변경금지

'R 분석과 프로그래밍 > R 그래프_시각화' 카테고리의 다른 글

R Graphics 낮은 수준의 그래프 함수 (3) 직선 연결, 추가 : lines(x, y), abline(a, b), abline(h=y), abline(v=x) (0)	2016.01.09
R Graphics 낮은 수준의 그래프 함수 (2) XY축 형태 변환 : axis(side, ...) (0)	2015.12.31
R 그래프 모수 (Graphical Parameters) : 그래프 영역 (mar, oma, , mfrow, mfcol, layout) (8)	2015.12.28
R 그래프 모수 (Graphical Parameters) : 색깔 (colors), col, col.axis, col.lab, col.main, col.sub, fg, bg (2)	2015.12.26
R 그래프 모수(Graphical Parameters) : 기호 모양 pch, 크기 cex, 선 유형 lty, 선 두께 lwd (0)	2015.12.26

Posted by Rfriend

R 그래프 모수 (Graphical Parameters) : 그래프 영역 (mar, oma, , mfrow, mfcol, layout)

R 분석과 프로그래밍/R 그래프_시각화 2015. 12. 28. 01:10

지난번 포스팅에서는 R Base Package의 Graphics plotting system의

(1) 높은 수준의 그래프 함수 (high level graphic functions)

(2) 그래프 모수를 설정하는 2가지 방법 (2 methods of setting graphic parameters)

(3) 그래프 모수 : 기호(symbol), 선(line)

(4) 그래프 모수 : 색깔(color)

에 대해서 알아보았습니다. 이번 포스팅에서는

(5) 그래프 모수 : 그래프 영역 (plot area, inner margin area, outer margin area, multiple plot layout) 에 대해서 소개하도록 하겠습니다.

그래프 영역은 크게 (1) 그래프 영역 (plot area), (2) 내부 마진 영역 (inner margin area), (3) 외부 마진 영역(outer margin area) 로 구분할 수 있습니다. 아래의 예시 그래프에 각 영역의 위치에 text 로 표기를 해보았습니다.

[ 그래프 영역 및 내부/외부 마진 영역 (plot area and inner/outer margin area) ]

그래프 영역 (plot area), 내부 마진 영역 (inner margin area)

(1) 그래프 영역 (plot area)는 점이든 선이든 기호가 그려지는 영역입니다.

(2) 내부 마진 영역 (inner margin area)는 plot area를 감싸고 있는 4개 모서리 부분의 마진입니다. 하단 부분이 1번, 왼쪽 부분이 2번, 상단부분이 3번, 오른쪽 부분이 4번이며, 순서대로 내부 마진 영역의 디폴트 값은 c(5.1, 4.1, 4.1, 2.1) 입니다. 하단은 x축 label, 왼쪽은 y축 label, 상단은 제목이 들어가는 영역이다 보니 디폴트 값의 마진 숫자가 큰 반면에, 오른쪽은 보통은 label이 없으므로 디폴트 마진 값이 타 영역의 반절밖에 안됩니다.

> ##-------------------------------------------
> ## Graph Area and Outer/Inner Margin
> ##-------------------------------------------
> 
> library(MASS) # to use Cars93 dataframe
> 
> # plotting by default par setting of plot area and inner margin area
> # default inner margin area : c(5.1, 4.1, 4.1, 2.1)
> 
> plot(MPG.highway ~ Weight, Cars93, type="p", 
+      xlab = "Inner Margin Area 1", 
+      ylab = "Inner Margin Area 2", 
+      main = "Inner Margin Area 3")
> 
> mtext("Inner Margin Area 4", side = 4)
> 
> text(3000, 35, cex = 3, labels = "Plot Area", pos = 3)

외부 마진 영역 (outer margin area)

외부 마진 영역은 내부 마진 영역의 바깥 쪽을 둘러싸는 마진 영역이며, 내부 마진 영역과 위치 순서는 똑같이 하단 부분이 1번, 왼쪽 부분이 2번, 상단 부분이 3번, 오른쪽 부분이 4번입니다. 1번, 2번, 3번, 4번 별로 디폴트 마진 값은 c(0, 0, 0, 0) 입니다. 즉 위의 예의 경우 외부 마진(outer margin) 을 별도로 지정해주지 않았으므로 디폴트 값이 적용되어 외부 마진(outer margin)은 모두 '0' 으로 없는 셈입니다.

외부 마진 영역은 위의 예처럼 1개짜리 그래프에서는 별 쓸모가 없습니다만 (그냥 내부 마진 영역으로 cover 되기 때문입니다), 그래프 영역을 분할해서 2개 이상의 그래프를 하나의 그래프에 결합할 경우 유용하게 사용할 수 있습니다. 개별 그래프에서는 내부 마진 영역에 제목, x축 label, y축 label을 적고, 2개 이상의 개별 그래프들을 모두 아우리는 대제목 (mega title)을 적고자 할 때 외부 마진 영역에 적으면 딱 좋습니다.

아래에 1개의 row, 2개의 column으로 영역을 분할(mfrow = )한 경우 외부 마진 영역 설정(oma = ), 내부 마진 영역 설정(mar = ) 함수의 예를 들어보겠습니다. 외부 마진 부분은 파란색으로 알아보기 쉽게 위치 표시를 했습니다.

참고로, op <- par(no.readonly = TRUE) 로 디폴트 par 값을 미리 할당해두면 나중에 par 값 조정 다 끝나고 원래의 디폴트 값으로 되돌아오고자 할 때 par(op)를 실행시키면 되므로 매우 편리합니다.

> ## -- inner margin area, outer margin area
> # Save default par values, for resetting later
> op <- par(no.readonly = TRUE)
> 
> # Change par() function options
> par(mfrow=c(1,2), # make frame by 1 row, 2 columns 
+     mar=c(4, 3, 3, 1), # inner margin
+     oma=c(0.5, 0.5, 2, 0.5)) # outer margin
> 
> # plot area, inner margin area, outer margin area
> plot(MPG.highway ~ Weight, Cars93, type="p", 
+      xlab = "Inner Margin Area", 
+      main = "Inner Margin Area")
> 
> plot(MPG.highway ~ Horsepower, Cars93, type="p", 
+      xlab = "Inner Margin Area", 
+      main = "Inner Margin Area")
> 
> mtext("Outer Margin Area", outer = TRUE, cex = 2, col = "blue") # outer = TRUE : outer margin area
> 
> 
> # Reset par to the default values at startup
> par(op)

영역 분할/결합 방법 1 : par(mfrow = ), par(mfcol = )

2개 이상의 다수의 그래프를 결합하는 방법에는 par() 함수와 layout() 함수의 2가지 방법이 있습니다. 먼저 par() 방법을 살펴보면, par(mfrow = ), par(mfcol = ) 의 2가지 모수 설정 방법이 있습니다. mfrow와 mfcol 은 아래의 말을 줄여 쓴 말입니다.

- mfrow : number of Multiple Figures (use ROW-wise)

- mfcol : number of Multiple Figures (use COLUMN-wise)

어렵지 않은 개념이므로 아래에 실제 예를 보면 바로 이해가 될 것이라고 봅니다. par(mfrow = c(4, 2)) 로 해서 4개 row, 2개 column으로 창을 분할해서 총 8개의 그래프를 결합한 예입니다. 그래프가 그려지는 순서를 화살표로 표시를 해두었는데요, 상단 왼쪽에서 시작해서 오른쪽으로 지그재그로 하단으로 내려가면서 그래프가 순차적으로 그려집니다.


> ##-- par(mfrow = ): multiple figures (use ROW-wise)
> par(mfrow=c(4, 2), # make window by 4 row, 2 columns 
+     mar=c(4, 3, 3, 1), # inner margin
+     oma=c(0.5, 0.5, 2, 0.5)) # outer margin
> 
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 1")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 2")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 3")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 4")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 5")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 6")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 7")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 8")
> 
> mtext("par(mfrow = c(4, 2)", outer = TRUE, cex = 2, col = "blue")

이번에는 par(mfcol = c(4, 2)) 설정된 예를 아래에 들어보았습니다. 위의 par(mfrow = c(4,2))처럼 4개의 row, 2개의 column 창이 만들어진 것은 동일합니다만, 그래프가 그려지는 순서는 다름에 유의하시기 바랍니다. par(mfcol = )은 column-wise 기준이어서 위에서 아래로 열이 다 찰 때까지 먼저 그래프가 그려지고, 그 다음에서야 오른쪽으로 넘어가서 다시 위에서부터 아래로 열을 채워가는 식으로 그래프가 순차적으로 그려지는 식입니다. 그래프를 그리고자 하는 순서, 형태에 대해서 먼저 생각을 해보시고, 원하는 순서/형태에 맞게 mfrow와 mfcol 을 선택하면 되겠습니다.

> ##-- par(mfcol = ) : multiple figures (use COLUMN-wise)
> par(mfcol=c(4, 2), # make frame by 1 row, 2 columns 
+     mar=c(4, 3, 3, 1), # inner margin
+     oma=c(0.5, 0.5, 2, 0.5)) # outer margin
> 
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 1")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 2")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 3")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 4")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 5")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 6")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 7")
> plot(MPG.highway ~ Weight, Cars93, type="p", main = "plot 8")
> 
> mtext("par(mfcol = c(4, 2)", outer = TRUE, cex = 2, col = "blue")

영역 분할/결합 방법 2 : layout()

layout() 함수를 사용하면 행렬(matrix,mat)로 분할하려는 그래프 영역의 순서(sequence)와 열의 폭과 행의 높이(widths of column, heights of row), 영역 나누기/합치기(divide/combine)를 자유롭게 조절할 수 있으므로 위에서 소개한 par(mfrow = ), par(mfcol = ) 보다 사용자에게 보다 높은 자유도를 제공하므로, 매우 유용하고 강력한 함수라고 하겠습니다.

layout() 함수는 par(mfrow = )나 par(mfcol = ) 함수와는 병행해서 사용할 수 없으므로 그래프 분석을 시작하기 전에 무슨 함수를 사용할 것인지 결정을 하고 하나를 선택해야만 합니다.

layout.show(n)은 현재의 layout에 대한 외곽선을 n 만큼의 그래프 갯수만큼 볼 수 있게 해주는 함수입니다.

아래에 layout()과 layout.show(n) 함수 예를 하나 들어보겠습니다. matrix() arguments 안의 숫자가 그래프가 그려지는 순서인데요, byrow=TRUE 로 했으므로 상단 왼쪽부터 시작해서 지그재그로 4개의 그래프를 그릴 수 있는 영역을 만들어보았습니다. byrow= FALSE 로 지정하면 왼쪽 위에서 왼쪽 아래로, 다시 오른쪽 위에서 오른쪽 아래 방향으로 그래프 생성 순서가 설정됩니다.

> ##-----------------------------------
> ## layout
> ##-----------------------------------
>
> # Save default par values
> op <- par(no.readonly = TRUE)
>  
 
> # divide the divice into 2 rows and 2 columns
> # allocate figure 1, 2, 3, 4 from upper left to lower right
> layout(matrix(c(1,2,3, 4), 2, 2, byrow = TRUE))
> 
> # show the current layout
 
> layout.show(4)

layout() 함수를 활용하면 그래프 영역을 합칠 수도 있습니다. 이게 par(mfrow = ) 또는 par(mfcol = ) 대비 꽤 유용한 기능 중의 하나입니다. 2 by 2 로 나눈 영역에서 1행 1열에만 그래프 영역 1개를 남겨놓고, 2행의 1열과 2행의 2열은 합쳐보는 예제를 아래에 들어보겠습니다.

숫자 '0'은 비어있는 그래프 영역이 되겠으며, 동일한 숫자를 행렬(matrix) 안에 나란히 입력하면 그 영역을 합쳐서 제시하라는 뜻입니다. 아래 예에서는 1행2열에 '0'이 입력되었으므로 비어있고, 2행1열과 2행 2열에 나란히 '2'가 기입되었으므로 2행1열과 2행2열이 합쳐져서 1개의 그래프 영역으로 표시가 되었습니다.

> ## divide the device into two rows and two columns
> ## allocate figure 1 the intersection of column 1 and row 1
> ## allocate figure 2 all of row 2
> layout(matrix(c(1,0,2,2), 2, 2, byrow = TRUE))
>

> ## show the current layout
> layout.show(2)

이해를 돕기위해서 이번에는 1행 1열과 1행 2열을 하나로 합치고, 2행 1열은 비워놓고 2행2열만 남겨놓는 layout을 만들어보는 예제를 아래에 들어보겠습니다.

> ## divide the device into two rows and two columns
> ## allocate figure 1 all of row 1
> ## allocate figure 2 the intersection of column 2 and row 2
> 
> layout(matrix(c(1, 1, 0, 2), 2, 2, byrow = TRUE))
> 
> ## show the current layout
> layout.show(2)

이번에는 10cm 정사각형 모양의 그래프 영역을 생성해보겠습니다. 폭은 widths = lcm( ) 으로, 높이는 heights = lcm( ) 으로 설정을 해주면 되겠습니다.

> ## create single figure of 10cm square
> layout_1 <- layout(matrix(1), widths = lcm(10), heights = lcm(10))
> layout.show(layout_1)

이번에는 그래프 생성 순서(sequence)의 위, 아래를 바꾸어 보고, 그래프의 넓이(widths)와 높이(heights)를 서로 다르게 하는 그래프 영역을 만들어보겠습니다. 가운데에 산포도를 그려놓고 상단과 우측에 작은 크기의 히스토그램이나 박스플롯을 병행해서 그릴 때 유용하게 사용할 수 있습니다.

참고로, respect = TRUE 는 가로 넓이와 세로 높이의 비율을 고려해서 그래프 영역을 설정하라는 옵션입니다.

> # divide device into two rows and two columns
> # allocate figure 1 the intersection of column 1 and row 2
> # allocate figure 2 the intersection of column 1 and row 1
> # allocate figure 3 the intersection of column 2 and row 2
> # no plot the intersection of column 2 and row 1
> # widths 8cm and 4cm respectively
> # heights 4cm and 8cm respectively
> # respect relations between widths and heights

> 
> layout_2 <- layout(matrix(c(2, 0, 1, 3), 2, 2,byrow = TRUE), 
+              widths = lcm(c(8, 4)), 
+              heights = lcm(c(4, 8)), 
+              respect = TRUE)
> 
> layout.show(layout_2)
>

> # Reset par to the default values at startup
> par(op)

다음번 포스팅에서는 '낮은 수준의 그래프 함수 (Low Level Graphics Functions)'에 대해서 알아보도록 하겠습니다. 앞서의 '높은 수준의 그래프 함수'와 '그래프 모수'에 대해서 예를 들 때 이미 '낮은 수준의 그래프 함수'를 곁들여서 사용하기는 했습니다만, 일목요연하게 한번 더 정리하고 개념을 확실하게 다잡는 다는 의미에서 다음번에 포스팅하도록 하겠습니다.

많은 도움이 되었기를 바랍니다.

이번 포스팅이 도움이 되었다면 아래의 '공감 ~♡' 단추를 꾸욱 눌러주세요.^^

728x90

저작자표시 비영리 변경금지

'R 분석과 프로그래밍 > R 그래프_시각화' 카테고리의 다른 글

R Graphics 낮은 수준의 그래프 함수 (2) XY축 형태 변환 : axis(side, ...) (0)	2015.12.31
R Graphics 낮은 수준의 그래프 함수 (1) 제목 및 XY축 라벨 추가 : title() (0)	2015.12.31
R 그래프 모수 (Graphical Parameters) : 색깔 (colors), col, col.axis, col.lab, col.main, col.sub, fg, bg (2)	2015.12.26
R 그래프 모수(Graphical Parameters) : 기호 모양 pch, 크기 cex, 선 유형 lty, 선 두께 lwd (0)	2015.12.26
R 그래프 모수 (Graphical Parameters) : 그래프 모수 설정하는 2가지 방법 (0)	2015.12.24

Posted by Rfriend

R 그래프 모수 (Graphical Parameters) : 색깔 (colors), col, col.axis, col.lab, col.main, col.sub, fg, bg

R 분석과 프로그래밍/R 그래프_시각화 2015. 12. 26. 19:43

지난번 포스팅에서는 R 그래프 모수(Graphical Parameters)를 설정하는 2가지 방법, 선의 유형(Line Type, lty)과 선의 두께(Line Width, lwd), 기호의 크기(Size of Character, cex) 옵션에 대해서 알아보았습니다.

이번 포스팅에서는 그래프 모수 중에서 색깔(color) 설정하는 방법에 대해서 알아보겠습니다.

[ 색 관련 모수 별 기능 설명 ]

색 관련 모수 (parameters of color)	기능 설명 (description)
col	기호, 선, 문자 등의 색깔을 디폴트로 지정 (default plotting color)
col.axis	축의 색 지정 (color for axis annotation)
col.lab	x축과 y축의 Label 색 지정 (color for x and y labels)
col.main	제목 색 지정 (color for main title)
col.sub	부제목의 색 지정 (color for sub titles)
fg	그래프 전경 색 지정 (color for foreground)
bg	그래프 배경 색 지정 (color for background)

아마도 대부분은 col 모수를 주로 사용하고 나머지 색상 관련 모수는 거의 사용하지 않을 듯 합니다만, R에서는 사용자가 원하면 거의 모든 부분의 색상을 원하는대로 설정할 수 있는 극강의 자유도를 제공합니다. R이 그래픽의 절대강자인 이유가 이처럼 다양한 모수를 제공해주는데 있습니다. 초보자라면 그냥 디폴트 옵션 사용하시면 되구요, 그래프에 욕심이 있는 분이라면 R의 색상 모수에 대해서 차근차근 공부해두시면 유용할 것입니다.

하나씩 차례대로 살펴보도록 하겠습니다.

기호, 선, 문자 등의 디폴트 색 지정 (default plotting color) : col

R에서 지원하는 색의 종류에는 657개가 있습니다. colors() 함수를 사용하면 657개 전체 색 리스트를 볼 수 가 있습니다.

> ##-------------------------------
> ## Graphical parameters : color
> ##-------------------------------
> 
> length(colors())
[1] 657
>

> colors()
  [1] "white"                "aliceblue"            "antiquewhite"        
  [4] "antiquewhite1"        "antiquewhite2"        "antiquewhite3"       
  [7] "antiquewhite4"        "aquamarine"           "aquamarine1"         
 [10] "aquamarine2"          "aquamarine3"          "aquamarine4"         
 [13] "azure"                "azure1"               "azure2"              
 [16] "azure3"               "azure4"               "beige"               
 [19] "bisque"               "bisque1"              "bisque2"             
 [22] "bisque3"              "bisque4"              "black"               
 [25] "blanchedalmond"       "blue"                 "blue1"               
 [28] "blue2"                "blue3"                "blue4"               
 [31] "blueviolet"           "brown"                "brown1"              
 [34] "brown2"               "brown3"               "brown4"              
 [37] "burlywood"            "burlywood1"           "burlywood2"          
 [40] "burlywood3"           "burlywood4"           "cadetblue"           
 [43] "cadetblue1"           "cadetblue2"           "cadetblue3"          
 [46] "cadetblue4"           "chartreuse"           "chartreuse1"         
 [49] "chartreuse2"          "chartreuse3"          "chartreuse4"         
 [52] "chocolate"            "chocolate1"           "chocolate2"          
 [55] "chocolate3"           "chocolate4"           "coral"               
 [58] "coral1"               "coral2"               "coral3"              
 [61] "coral4"               "cornflowerblue"       "cornsilk"            
 [64] "cornsilk1"            "cornsilk2"            "cornsilk3"           
 [67] "cornsilk4"            "cyan"                 "cyan1"               
 [70] "cyan2"                "cyan3"                "cyan4"               
 [73] "darkblue"             "darkcyan"             "darkgoldenrod"       
 [76] "darkgoldenrod1"       "darkgoldenrod2"       "darkgoldenrod3"      
 [79] "darkgoldenrod4"       "darkgray"             "darkgreen"           
 [82] "darkgrey"             "darkkhaki"            "darkmagenta"         
 [85] "darkolivegreen"       "darkolivegreen1"      "darkolivegreen2"     
 [88] "darkolivegreen3"      "darkolivegreen4"      "darkorange"          
 [91] "darkorange1"          "darkorange2"          "darkorange3"         
 [94] "darkorange4"          "darkorchid"           "darkorchid1"         
 [97] "darkorchid2"          "darkorchid3"          "darkorchid4"         
[100] "darkred"              "darksalmon"           "darkseagreen"        
[103] "darkseagreen1"        "darkseagreen2"        "darkseagreen3"       
[106] "darkseagreen4"        "darkslateblue"        "darkslategray"       
[109] "darkslategray1"       "darkslategray2"       "darkslategray3"      
[112] "darkslategray4"       "darkslategrey"        "darkturquoise"       
[115] "darkviolet"           "deeppink"             "deeppink1"           
[118] "deeppink2"            "deeppink3"            "deeppink4"           
[121] "deepskyblue"          "deepskyblue1"         "deepskyblue2"        
[124] "deepskyblue3"         "deepskyblue4"         "dimgray"             
[127] "dimgrey"              "dodgerblue"           "dodgerblue1"         
[130] "dodgerblue2"          "dodgerblue3"          "dodgerblue4"         
[133] "firebrick"            "firebrick1"           "firebrick2"          
[136] "firebrick3"           "firebrick4"           "floralwhite"         
[139] "forestgreen"          "gainsboro"            "ghostwhite"          
[142] "gold"                 "gold1"                "gold2"               
[145] "gold3"                "gold4"                "goldenrod"           
[148] "goldenrod1"           "goldenrod2"           "goldenrod3"          
[151] "goldenrod4"           "gray"                 "gray0"               
[154] "gray1"                "gray2"                "gray3"               
[157] "gray4"                "gray5"                "gray6"               
[160] "gray7"                "gray8"                "gray9"               
[163] "gray10"               "gray11"               "gray12"              
[166] "gray13"               "gray14"               "gray15"              
[169] "gray16"               "gray17"               "gray18"              
[172] "gray19"               "gray20"               "gray21"              
[175] "gray22"               "gray23"               "gray24"              
[178] "gray25"               "gray26"               "gray27"              
[181] "gray28"               "gray29"               "gray30"              
[184] "gray31"               "gray32"               "gray33"              
[187] "gray34"               "gray35"               "gray36"              
[190] "gray37"               "gray38"               "gray39"              
[193] "gray40"               "gray41"               "gray42"              
[196] "gray43"               "gray44"               "gray45"              
[199] "gray46"               "gray47"               "gray48"              
[202] "gray49"               "gray50"               "gray51"              
[205] "gray52"               "gray53"               "gray54"              
[208] "gray55"               "gray56"               "gray57"              
[211] "gray58"               "gray59"               "gray60"              
[214] "gray61"               "gray62"               "gray63"              
[217] "gray64"               "gray65"               "gray66"              
[220] "gray67"               "gray68"               "gray69"              
[223] "gray70"               "gray71"               "gray72"              
[226] "gray73"               "gray74"               "gray75"              
[229] "gray76"               "gray77"               "gray78"              
[232] "gray79"               "gray80"               "gray81"              
[235] "gray82"               "gray83"               "gray84"              
[238] "gray85"               "gray86"               "gray87"              
[241] "gray88"               "gray89"               "gray90"              
[244] "gray91"               "gray92"               "gray93"              
[247] "gray94"               "gray95"               "gray96"              
[250] "gray97"               "gray98"               "gray99"              
[253] "gray100"              "green"                "green1"              
[256] "green2"               "green3"               "green4"              
[259] "greenyellow"          "grey"                 "grey0"               
[262] "grey1"                "grey2"                "grey3"               
[265] "grey4"                "grey5"                "grey6"               
[268] "grey7"                "grey8"                "grey9"               
[271] "grey10"               "grey11"               "grey12"              
[274] "grey13"               "grey14"               "grey15"              
[277] "grey16"               "grey17"               "grey18"              
[280] "grey19"               "grey20"               "grey21"              
[283] "grey22"               "grey23"               "grey24"              
[286] "grey25"               "grey26"               "grey27"              
[289] "grey28"               "grey29"               "grey30"              
[292] "grey31"               "grey32"               "grey33"              
[295] "grey34"               "grey35"               "grey36"              
[298] "grey37"               "grey38"               "grey39"              
[301] "grey40"               "grey41"               "grey42"              
[304] "grey43"               "grey44"               "grey45"              
[307] "grey46"               "grey47"               "grey48"              
[310] "grey49"               "grey50"               "grey51"              
[313] "grey52"               "grey53"               "grey54"              
[316] "grey55"               "grey56"               "grey57"              
[319] "grey58"               "grey59"               "grey60"              
[322] "grey61"               "grey62"               "grey63"              
[325] "grey64"               "grey65"               "grey66"              
[328] "grey67"               "grey68"               "grey69"              
[331] "grey70"               "grey71"               "grey72"              
[334] "grey73"               "grey74"               "grey75"              
[337] "grey76"               "grey77"               "grey78"              
[340] "grey79"               "grey80"               "grey81"              
[343] "grey82"               "grey83"               "grey84"              
[346] "grey85"               "grey86"               "grey87"              
[349] "grey88"               "grey89"               "grey90"              
[352] "grey91"               "grey92"               "grey93"              
[355] "grey94"               "grey95"               "grey96"              
[358] "grey97"               "grey98"               "grey99"              
[361] "grey100"              "honeydew"             "honeydew1"           
[364] "honeydew2"            "honeydew3"            "honeydew4"           
[367] "hotpink"              "hotpink1"             "hotpink2"            
[370] "hotpink3"             "hotpink4"             "indianred"           
[373] "indianred1"           "indianred2"           "indianred3"          
[376] "indianred4"           "ivory"                "ivory1"              
[379] "ivory2"               "ivory3"               "ivory4"              
[382] "khaki"                "khaki1"               "khaki2"              
[385] "khaki3"               "khaki4"               "lavender"            
[388] "lavenderblush"        "lavenderblush1"       "lavenderblush2"      
[391] "lavenderblush3"       "lavenderblush4"       "lawngreen"           
[394] "lemonchiffon"         "lemonchiffon1"        "lemonchiffon2"       
[397] "lemonchiffon3"        "lemonchiffon4"        "lightblue"           
[400] "lightblue1"           "lightblue2"           "lightblue3"          
[403] "lightblue4"           "lightcoral"           "lightcyan"           
[406] "lightcyan1"           "lightcyan2"           "lightcyan3"          
[409] "lightcyan4"           "lightgoldenrod"       "lightgoldenrod1"     
[412] "lightgoldenrod2"      "lightgoldenrod3"      "lightgoldenrod4"     
[415] "lightgoldenrodyellow" "lightgray"            "lightgreen"          
[418] "lightgrey"            "lightpink"            "lightpink1"          
[421] "lightpink2"           "lightpink3"           "lightpink4"          
[424] "lightsalmon"          "lightsalmon1"         "lightsalmon2"        
[427] "lightsalmon3"         "lightsalmon4"         "lightseagreen"       
[430] "lightskyblue"         "lightskyblue1"        "lightskyblue2"       
[433] "lightskyblue3"        "lightskyblue4"        "lightslateblue"      
[436] "lightslategray"       "lightslategrey"       "lightsteelblue"      
[439] "lightsteelblue1"      "lightsteelblue2"      "lightsteelblue3"     
[442] "lightsteelblue4"      "lightyellow"          "lightyellow1"        
[445] "lightyellow2"         "lightyellow3"         "lightyellow4"        
[448] "limegreen"            "linen"                "magenta"             
[451] "magenta1"             "magenta2"             "magenta3"            
[454] "magenta4"             "maroon"               "maroon1"             
[457] "maroon2"              "maroon3"              "maroon4"             
[460] "mediumaquamarine"     "mediumblue"           "mediumorchid"        
[463] "mediumorchid1"        "mediumorchid2"        "mediumorchid3"       
[466] "mediumorchid4"        "mediumpurple"         "mediumpurple1"       
[469] "mediumpurple2"        "mediumpurple3"        "mediumpurple4"       
[472] "mediumseagreen"       "mediumslateblue"      "mediumspringgreen"   
[475] "mediumturquoise"      "mediumvioletred"      "midnightblue"        
[478] "mintcream"            "mistyrose"            "mistyrose1"          
[481] "mistyrose2"           "mistyrose3"           "mistyrose4"          
[484] "moccasin"             "navajowhite"          "navajowhite1"        
[487] "navajowhite2"         "navajowhite3"         "navajowhite4"        
[490] "navy"                 "navyblue"             "oldlace"             
[493] "olivedrab"            "olivedrab1"           "olivedrab2"          
[496] "olivedrab3"           "olivedrab4"           "orange"              
[499] "orange1"              "orange2"              "orange3"             
[502] "orange4"              "orangered"            "orangered1"          
[505] "orangered2"           "orangered3"           "orangered4"          
[508] "orchid"               "orchid1"              "orchid2"             
[511] "orchid3"              "orchid4"              "palegoldenrod"       
[514] "palegreen"            "palegreen1"           "palegreen2"          
[517] "palegreen3"           "palegreen4"           "paleturquoise"       
[520] "paleturquoise1"       "paleturquoise2"       "paleturquoise3"      
[523] "paleturquoise4"       "palevioletred"        "palevioletred1"      
[526] "palevioletred2"       "palevioletred3"       "palevioletred4"      
[529] "papayawhip"           "peachpuff"            "peachpuff1"          
[532] "peachpuff2"           "peachpuff3"           "peachpuff4"          
[535] "peru"                 "pink"                 "pink1"               
[538] "pink2"                "pink3"                "pink4"               
[541] "plum"                 "plum1"                "plum2"               
[544] "plum3"                "plum4"                "powderblue"          
[547] "purple"               "purple1"              "purple2"             
[550] "purple3"              "purple4"              "red"                 
[553] "red1"                 "red2"                 "red3"                
[556] "red4"                 "rosybrown"            "rosybrown1"          
[559] "rosybrown2"           "rosybrown3"           "rosybrown4"          
[562] "royalblue"            "royalblue1"           "royalblue2"          
[565] "royalblue3"           "royalblue4"           "saddlebrown"         
[568] "salmon"               "salmon1"              "salmon2"             
[571] "salmon3"              "salmon4"              "sandybrown"          
[574] "seagreen"             "seagreen1"            "seagreen2"           
[577] "seagreen3"            "seagreen4"            "seashell"            
[580] "seashell1"            "seashell2"            "seashell3"           
[583] "seashell4"            "sienna"               "sienna1"             
[586] "sienna2"              "sienna3"              "sienna4"             
[589] "skyblue"              "skyblue1"             "skyblue2"            
[592] "skyblue3"             "skyblue4"             "slateblue"           
[595] "slateblue1"           "slateblue2"           "slateblue3"          
[598] "slateblue4"           "slategray"            "slategray1"          
[601] "slategray2"           "slategray3"           "slategray4"          
[604] "slategrey"            "snow"                 "snow1"               
[607] "snow2"                "snow3"                "snow4"               
[610] "springgreen"          "springgreen1"         "springgreen2"        
[613] "springgreen3"         "springgreen4"         "steelblue"           
[616] "steelblue1"           "steelblue2"           "steelblue3"          
[619] "steelblue4"           "tan"                  "tan1"                
[622] "tan2"                 "tan3"                 "tan4"                
[625] "thistle"              "thistle1"             "thistle2"            
[628] "thistle3"             "thistle4"             "tomato"              
[631] "tomato1"              "tomato2"              "tomato3"             
[634] "tomato4"              "turquoise"            "turquoise1"          
[637] "turquoise2"           "turquoise3"           "turquoise4"          
[640] "violet"               "violetred"            "violetred1"          
[643] "violetred2"           "violetred3"           "violetred4"          
[646] "wheat"                "wheat1"               "wheat2"              
[649] "wheat3"               "wheat4"               "whitesmoke"          
[652] "yellow"               "yellow1"              "yellow2"             
[655] "yellow3"              "yellow4"              "yellowgreen"

위처럼 text로 색깔 이름만 있으면 알기 어려울 수도 있는데요, Earl F. Glynn 가 657개 색을 각 숫자별로 그리드에 색을 보기에 좋도록 정리를 해놓았습니다.

[ Color Chart by Earl F. Glynn, Stowers Institute for Medical Research, 24 May 2005 ]

* 출처 : http://research.stowers-institute.org/efg/R/Color/Chart/index.htm

R에서 색을 지정하는 방법에는 (1) 숫자 (index), (2) 색 이름 (color name), (3) 16진수 (hexadecimal), (4) RGB 색상표의 4가지 방법이 있습니다.

숫자 (index)	색 이름 (color name)	16진수 (hexadecimal)	RGB triple
4	(26번) blue	#0000FF	0 0 255
NA	(62번) comflowerblue	#6495ED	100 149 237
NA	(73번) darkblue	#00008B	0 0 139

먼저 (1) 숫자(index)로 지정하는 방법은 편하긴 한데요, 선택할 수 있는 색은 아래와 같이 8가지가 있어서 매우 제한적입니다.

index

color

흰색

(white)

검정색

(black)

빨강색

(red)

초록색

(green)

파랑색

(blue)

청록색

(turquoise)

자홍색

(magenta)

노란색

(yellow)

회색

(gray)

> # color by index 1~8
> par(mfrow=c(1,2))
> pie(rep(1, 8), col = 1:8)
> pie(rep(1, 16), col = 1:16)

반면, (2) 이름(color name), (3) 16진법 표기 (hexadecimal), (4) RGB 색상표 (RGB triple) 은 매우 다양한 색상을 선택할 수 있는 장점이 있습니다. 아래는 Earl F. Glynn 가 작성한 색상표에서 일부를 화면캡쳐한 내용인데요, 모든 색상표는 아래의 출처에 있는 pdf url에 있습니다.

* 출처 : http://research.stowers-institute.org/efg/R/Color/Chart/ColorChart.pdf

파란색(blue)에 대해서 위의 4가지 방법, 즉 (1) 숫자 (index), (2) 색 이름 (color name), (3) 16진수 (hexadecimal), (4) RGB 색상표를 사용해서 R 함수 예를 들어보겠습니다. 파란색(blue)으로 모두 똑같은 결과가 나았습니다.

> ## 4 methods of color 'blue' exmaple : index, color name, hexadecimal, RGB
> 
> library(MASS) # to use Cars933 dataframe
> 
> par(mfrow = c(2,2))
> 
> # method 1 : index
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 19, 
+      col = 4, main = "col = 4 (index)")
> 
> # method 2 : color name
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 19, 
+      col = "blue", main = "col = blue (name)")
> 
> # method 3 : hexadecimal
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 19, 
+      col = "#0000FF", main = "col = #0000FF (hexadecimal)")
> 
> # method 4 : RGB triple
> rgb_1 <- rgb(0, 0, 255, maxColorValue=255)
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 19, 
+      col = rgb_1, main = "col = RGB(0, 0, 255)(RGB triple)")

R에서는 색상 관련해서 서로 보완(complementing)되거나 대조를 이루는(contrasting) 색상들을 미리 파레트 형식으로 정의(defined palettes of colors)해 놓은 것이 있습니다. rainbow(n), heat.colors(n), terrain.colors(n), topo.colors(n), cm.colors(n) 등이 있는데요, example(rainbow) 함수를 이용해서 이들 색상표 palettes 를 살펴보겠습니다. 계속 Enter 치면 다음 화면으로 넘어갑니다.

[ 색상 파레트 (defined palattes of colors) ]

> ## example of rainbow palette's colors

> example(rainbow)

rainbw> require(graphics)

rainbw> # A Color Wheel
rainbw> pie(rep(1, 12), col = rainbow(12))


Hit <Return> to see next plot: 

rainbw> ##------ Some palettes ------------
rainbw> demo.pal <-
rainbw+   function(n, border = if (n < 32) "light gray" else NA,
rainbw+            main = paste("color palettes;  n=", n),
rainbw+            ch.col = c("rainbow(n, start=.7, end=.1)", "heat.colors(n)",
rainbw+                       "terrain.colors(n)", "topo.colors(n)",
rainbw+                       "cm.colors(n)"))
rainbw+ {
rainbw+     nt <- length(ch.col)
rainbw+     i <- 1:n; j <- n / nt; d <- j/6; dy <- 2*d
rainbw+     plot(i, i+d, type = "n", yaxt = "n", ylab = "", main = main)
rainbw+     for (k in 1:nt) {
rainbw+         rect(i-.5, (k-1)*j+ dy, i+.4, k*j,
rainbw+              col = eval(parse(text = ch.col[k])), border = border)
rainbw+         text(2*j,  k * j + dy/4, ch.col[k])
rainbw+     }
rainbw+ }

rainbw> n <- if(.Device == "postscript") 64 else 16

rainbw>      # Since for screen, larger n may give color allocation problem
rainbw> demo.pal(n)
Hit <Return> to see next plot: 
>

축 색 지정 (color for axis annotation) : col.axis

x축과 y축의 척도 표기 색상을 지정할 때 col.axis 모수 옵션을 사용합니다. 아래에 x축과 y축 척도 표기 색상으로 파랑색, 빨강색, 노랑색, 회색으로 바꿔가면서 그래프를 그려보았습니다.

> ## color for axis annotation : col.axis

> library(MASS) # to use Cars93 dataframe
> par(mfrow = c(2,2))
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.axis = "blue", main = "col.axis = blue")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.axis = "red", main = "col.axis = red")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.axis = "yellow", main = "col.axis = yellow")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.axis = "gray", main = "col.axis = gray")

x축과 y축 Label 지정 (color for x and y labels) : col.lab

이번에는 x축과 y의 Lable 색을 지정하는 방법으로 col.lab 모수 옵션을 사용하면 됩니다. 파랑색, 빨강색, 노랑색, 회색으로 x축과 y축의 Lable 색을 설정하는 예를 들어보겠습니다.

> ## color for x and y labels : col.lab
> library(MASS)
> par(mfrow = c(2,2))
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.lab = "blue", main = "col.lab = blue")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.lab = "red", main = "col.lab = red")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.lab = "yellow", main = "col.lab = yellow")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.lab = "gray", main = "col.lab = gray")

제목 색 지정 (color for main title) : col.main

> ## color for main title : col.main
> library(MASS)
> par(mfrow = c(2, 2))
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.main = "blue", main = "col.main = blue")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.main = "red", main = "col.main = red")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.main = "yellow", main = "col.main = yellow")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.main = "gray", main = "col.main = gray")

부제목 색 지정 (color for sub title) : col.sub

> ## color for sub title : col.sub
> library(MASS)
> par(mfrow = c(2, 2))
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.sub = "blue", sub = "col.sub = blue")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.sub = "red", sub = "col.sub = red")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.sub = "yellow", sub = "col.sub = yellow")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      col.sub = "gray", sub = "col.sub = gray")

그래프 전경 색 지정 (color for foreground) : fg

> ## color for foreground : fg
> library(MASS)
> par(mfrow = c(2, 2))
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      fg = "blue", main = "fg (foreground) = blue")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      fg = "red", main = "fg (foreground) = red")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      fg = "yellow", main = "fg (foreground) = yellow")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 1, pch = 21, 
+      fg = "gray", main = "fg(foreground) = gray")

그래프 배경 색 지정 (color for background) : bg

bg는 그래프 기호의 배경색을 채울 때 사용합니다. 아래에 기호 모양 21번 (원)에 파랑색, 빨강색, 노랑색, 회색을 채워보았습니다.

> ## color for background :bg
> library(MASS)
> par(mfrow = c(2, 2))
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 21, 
+      bg = "blue", main = "bg (background) = blue")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 21, 
+      bg = "red", main = "bg (background) = red")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 21, 
+      bg = "yellow", main = "bg (background) = yellow")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 21, 
+      bg = "gray", main = "bg (background) = gray")

bg (background color)는 속이 비어있는 pch 21번부터 25번 까지만 사용가능하며, 그 외에는 적용이 안됩니다. 아래에 pch =1 일 때 bg 옵션이 적용이 안된 것을 확인할 수 있습니다.

> ## bg (background color) only works with pch from 21 to 25
> 
> library(MASS)
> par(mfrow=c(3,2))
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 1, 
+      bg = "blue", main = "pch = 1, bg is not working")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 21, 
+      bg = "blue", main = "pch = 21, bg is working")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 22, 
+      bg = "blue", main = "pch = 22, bg is working")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 23, 
+      bg = "blue", main = "pch = 23, bg is working")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 24, 
+      bg = "blue", main = "pch = 24, bg is working")
> 
> plot(MPG.highway ~ Weight, Cars93, cex = 2, pch = 25, 
+      bg = "blue", main = "pch = 25, bg is working")

다음번 포스팅에서는 그래프 영역과 내/외부 마진 모수 설정하는 방법에 대해서 알아보도록 하겠습니다.

많은 도움 되었기를 바랍니다.

이번 포스팅이 도움이 되었다면 아래의 '공감 ~♡' 단추를 꾸욱 눌러주세요.^^

728x90

저작자표시 비영리 변경금지

'R 분석과 프로그래밍 > R 그래프_시각화' 카테고리의 다른 글

R Graphics 낮은 수준의 그래프 함수 (1) 제목 및 XY축 라벨 추가 : title() (0)	2015.12.31
R 그래프 모수 (Graphical Parameters) : 그래프 영역 (mar, oma, , mfrow, mfcol, layout) (8)	2015.12.28
R 그래프 모수(Graphical Parameters) : 기호 모양 pch, 크기 cex, 선 유형 lty, 선 두께 lwd (0)	2015.12.26
R 그래프 모수 (Graphical Parameters) : 그래프 모수 설정하는 2가지 방법 (0)	2015.12.24
R 그래프 Base Graphics plotting system : hist() boxplot(), stem(), barplot(), dotchart(), pie(), plot() (4)	2015.12.24

Posted by Rfriend

R 그래프 모수(Graphical Parameters) : 기호 모양 pch, 크기 cex, 선 유형 lty, 선 두께 lwd

R 분석과 프로그래밍/R 그래프_시각화 2015. 12. 26. 12:06

지난번 포스팅에서 R 그래프 모수 (Graphical Parameters)를 설정하는 2가지 방법(par(), arguments)에 대해서 소개하였습니다.

이번 포스팅에서는 그래프 모수의 기호, 선 모수 설정에 대해서 하나씩 예를 들어보면서 자세히 설명해보겠습니다.

(그래프 모수가 70여 가지가 되므로 모두를 설명하기에는 무리가 있으며, 자주 사용하는 것들 위주로 선별해서 소개합니다. ?par 로 도움말을 찾아보시면 모든 그래프 모수에 대한 도움말을 검색할 수 있습니다)

기호 (plotting symbols, characters) : pch=

그래픽 모수 pch 를 사용해서 다양한 모양의 기호, 상징을 그릴 수 있습니다. 디폴트는 pch=1 로서 속이 빈 원 모양이며, 아래의 pch 그래픽 모수 숫자별 모양을 참고해서 원하는 모양의 숫자를 pch = '숫자' 로 입력하면 되겠습니다.

MASS 패키지 내 Cars93 데이터프레임의 차 무게(Weight)와 고속도로연비(MPG.highway) 변수를 가지고 산포도 그래프를 아래와 같이 그려보았습니다. pch=1 ~ pch=6 까지 6개만 예로 들어보았습니다.

> ## symbol and character of plotting : pch=
> library(MASS)
> 
> par(mfrow = c(3,2))
> 
> 
> plot(MPG.highway ~ Weight, data = Cars93, pch = 1, main = "pch = 1")
> plot(MPG.highway ~ Weight, data = Cars93, pch = 2, main = "pch = 2")
> plot(MPG.highway ~ Weight, data = Cars93, pch = 3, main = "pch = 3")
> plot(MPG.highway ~ Weight, data = Cars93, pch = 4, main = "pch = 4")
> plot(MPG.highway ~ Weight, data = Cars93, pch = 5, main = "pch = 5")
> plot(MPG.highway ~ Weight, data = Cars93, pch = 6, main = "pch = 6")

> 
> par(mfrow = c(1,1))

기호 직접 입력하는 방법 (specifying character directly)

pch = 1 처럼 숫자를 입력하는 방법 말고도 pch = '$', pch = '%', pch = '*'처럼 기호를 직접 pch 다음에 직접 입력해도 됩니다.

> ## specifying character directly
> par(mfrow = c(1,3))
> plot(MPG.highway ~ Weight, data = Cars93, pch = '$', main = "pch = '$' ")
> plot(MPG.highway ~ Weight, data = Cars93, pch = '%', main = "pch = '%' ")
> plot(MPG.highway ~ Weight, data = Cars93, pch = '*', main = "pch = '*' ")

기호의 크기 : cex

cex는 기호의 크기를 지정할 때 사용합니다. cex=1 이 디폴트 크기이며, cex 다음에 입력하는 숫자는 디폴트 대비 상대적인 크기를 나타냅니다.

> ## symbol size : cex
> par(mfrow = c(2, 3)) # plot display by 2 row and 3 column
> plot(MPG.highway ~ Weight, data = Cars93, pch = 19, cex = 0.5, main = "cex = 0.5")
> plot(MPG.highway ~ Weight, data = Cars93, pch = 19, cex = 1, main = "cex = 1 (default)")
> plot(MPG.highway ~ Weight, data = Cars93, pch = 19, cex = 1.5, main = "cex = 1.5")
> plot(MPG.highway ~ Weight, data = Cars93, pch = 19, cex = 2, main = "cex = 2")
> plot(MPG.highway ~ Weight, data = Cars93, pch = 19, cex = 3, main = "cex = 3")
> plot(MPG.highway ~ Weight, data = Cars93, pch = 19, cex = 4, main = "cex = 4")

선 유형 (line types) : lty

R 그래프 모수에서 제공하는 선 유형에는 아래과 같이 6개가 있습니다.

> ## line types : lty
> 
> # ordering by Weight
> Cars93_order <- Cars93[order(Cars93$Weight),]
> 
> par(mfrow = c(2, 3)) # plot layout by 2 row and 3 column
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lty = 1, main = "lty = 1")
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lty = 2, main = "lty = 2")
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lty = 3, main = "lty = 3")
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lty = 4, main = "lty = 4")
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lty = 5, main = "lty = 5")
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lty = 6, main = "lty = 6")

선 두께 (line width) : lwd

선 두께를 조절하는 그래프 모수는 lwd 입니다. lwd = 1 이 디폴트 값이며, 이 숫자를 기준으로 숫자만큼 선 두께가 배수가 됩니다. 아래에 lwd = 0.5, 1, 2, 3, 4, 5 별로 선 두께가 어떻게 변화하는지 예를 들어보았습니다. 참고로, plot(x, y, dataset, type = "l") 로 하면 선 그래프 (line plot)를 그릴 수 있습니다.

> ## line width : lwd
> 
> # ordering by Weight
> Cars93_order <- Cars93[order(Cars93$Weight),]
> 
> par(mfrow = c(2, 3)) # plot display by 2 row and 3 column
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lwd = 0.5, main = "lwd = 0.5")
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lwd = 1, main = "lwd = 1 (default)")
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lwd = 2, main = "lwd = 2")
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lwd = 3, main = "lwd = 3")
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lwd = 4, main = "lwd = 4")
> plot(MPG.highway ~ Weight, data = Cars93_order, type = "l", lwd = 5, main = "lwd = 5")

현재 그래프 모수 확인 (checking current graphical parameter settings) : par()

참고로, par() 함수를 쓰면 현재의 그래프 모수를 확인해볼 수 있습니다. 갯수를 세어보니 총 72개 graphical parameter 가 있네요.

> # to see current graphical parameter settings
> par()
$xlog
[1] FALSE

$ylog
[1] FALSE

$adj
[1] 0.5

$ann
[1] TRUE

$ask
[1] FALSE

$bg
[1] "white"

$bty
[1] "o"

$cex
[1] 1

$cex.axis
[1] 1

$cex.lab
[1] 1

$cex.main
[1] 1.2

$cex.sub
[1] 1

$cin
[1] 0.2000000 0.2666667

$col
[1] "black"

$col.axis
[1] "black"

$col.lab
[1] "black"

$col.main
[1] "black"

$col.sub
[1] "black"

$cra
[1] 14.4 19.2

$crt
[1] 0

$csi
[1] 0.2666667

$cxy
[1] 0.02623142 0.05008347

$din
[1] 9.277778 7.777778

$err
[1] 0

$family
[1] ""

$fg
[1] "black"

$fig
[1] 0 1 0 1

$fin
[1] 9.277778 7.777778

$font
[1] 1

$font.axis
[1] 1

$font.lab
[1] 1

$font.main
[1] 2

$font.sub
[1] 1

$lab
[1] 5 5 7

$las
[1] 0

$lend
[1] "round"

$lheight
[1] 1

$ljoin
[1] "round"

$lmitre
[1] 10

$lty
[1] "solid"

$lwd
[1] 1

$mai
[1] 1.360000 1.093333 1.093333 0.560000

$mar
[1] 5.1 4.1 4.1 2.1

$mex
[1] 1

$mfcol
[1] 1 1

$mfg
[1] 1 1 1 1

$mfrow
[1] 1 1

$mgp
[1] 3 1 0

$mkh
[1] 0.001

$new
[1] FALSE

$oma
[1] 0 0 0 0

$omd
[1] 0 1 0 1

$omi
[1] 0 0 0 0

$page
[1] TRUE

$pch
[1] 1

$pin
[1] 7.624444 5.324444

$plt
[1] 0.1178443 0.9396407 0.1748571 0.8594286

$ps
[1] 16

$pty
[1] "m"

$smo
[1] 1

$srt
[1] 0

$tck
[1] NA

$tcl
[1] -0.5

$usr
[1] 0 1 0 1

$xaxp
[1] 0 1 5

$xaxs
[1] "r"

$xaxt
[1] "s"

$xpd
[1] FALSE

$yaxp
[1] 0 1 5

$yaxs
[1] "r"

$yaxt
[1] "s"

$ylbias
[1] 0.2

다음번 포스팅에서는 색깔과 관련된 그래프 모수에 대해서 알아보도록 하겠습니다.

많은 도움이 되었기를 바랍니다.

이번 포스팅이 도움이 되었다면 아래의 '공감 ~♡' 단추를 꾸욱 눌러주세요.^^

728x90

저작자표시 비영리 변경금지

'R 분석과 프로그래밍 > R 그래프_시각화' 카테고리의 다른 글

R 그래프 모수 (Graphical Parameters) : 그래프 영역 (mar, oma, , mfrow, mfcol, layout) (8)	2015.12.28
R 그래프 모수 (Graphical Parameters) : 색깔 (colors), col, col.axis, col.lab, col.main, col.sub, fg, bg (2)	2015.12.26
R 그래프 모수 (Graphical Parameters) : 그래프 모수 설정하는 2가지 방법 (0)	2015.12.24
R 그래프 Base Graphics plotting system : hist() boxplot(), stem(), barplot(), dotchart(), pie(), plot() (4)	2015.12.24
R 동적 그래프 (Interactive Plotting in R) : with manipulate package in Rstudio (0)	2015.09.12

Posted by Rfriend

R 그래프 모수 (Graphical Parameters) : 그래프 모수 설정하는 2가지 방법

R 분석과 프로그래밍/R 그래프_시각화 2015. 12. 24. 13:44

이전 포스팅에서 Base Graphics plotting system에서 그래프의 기본 골격을 생성하는 높은 수준의 그래프 함수 (High Level Graphics Function)에 대해서 알아보았습니다.

이번 포스팅에서는 그래프의 기호, 선, 색깔, 마진, 영역 분할 등 그래프의 세부적인 옵션들을 설정하는 방법으로 '그래프 모수 (Graphical Parameters)' 에 대해서 소개하겠습니다.

그래프 모수에는 약 70여가지가 있는데요, 포스팅에서 전부 다루기에는 무리가 있어서 활용 빈도가 높다고 생각하는 항목들만을 선별해서 소개하겠습니다. R의 콘솔 창에 '?par' 라고 입력하면 graphical parameter setting 관련한 도움말을 참고할 수 있습니다.

그래프 모수를 설정하는 방법에는 2가지가 있습니다.

첫번째 방법은 par() 함수를 이용해서 이후에 생성하는 그래프 전체에 일괄적으로 동일하게 모수를 적용하는 방법입니다 (global environment). 동일한 모수 설정치로 다수의 그래프를 그려야 하는 상황이라면 편리하게 사용할 수 있는 방법입니다. 일부 그래프 모수는 이 첫번째 방법으로만 설정할 수 있습니다. (예: 영역분할 mfrow 등)

두번째 방법은 그래프를 그릴 때마다 매번 함수 내에서 그래프 모수를 일일이 지정해주는 방법입니다. 그래프를 한두개 그리고 말거라거나, 다수의 그래프를 그려야하기는 하는데 모수 설정치가 매번 다르다면 두번째 방법을 사용하는게 편하겠습니다.

[ 그래프 모수를 설정하는 2가지 방법 ]

(2 methods of setting graphical parameters)

(1) 아래에 첫번째 방법으로 par() 함수를 이용해서 그래프 모수를 설정하는 예를 들어보았습니다. MASS 패키지에 내장되어 있는 Cars93 데이터프레임의 차무게(Weight)와 마력(Horsepower)과 고속도로연비(MPG.highway) 간의 관계를 알아보기 위해 산포도를 그려본 예제입니다.

par() 함수를 사용해서 global environment에 그래프 모수를 설정할 때는 나중에 디폴트 그래프 모수로 돌아와야 하는 상황에서 편리하게 사용할 수 있도록 par(no.readonly = TRUE) 를 par_origin 이라는 객체에 할당해서 저장해 두었다가, 그래프 다 그리고 나서 제일 마지막에 par(par_origin)로 원래의 그래프 모수로 원복하였습니다.

> ##-----------------------
> ## Graphical Parameters
> 
> # help on par() function
> ?par
> 
> 
> library(MASS) # to use Cars93 dataframe
> 
> # method 1 : par()
> # saving original graphical parameters setting
> par_origin <- par(no.readonly = TRUE)
> 
> # setting new graphical parameters
> par(pch = 15, col = "blue")
> 
> plot(MPG.highway ~ Weight, type = "p", Cars93)
> 

> 
> plot(MPG.highway ~ Horsepower, type = "p", Cars93)
> 

> 
> # returning to original parameter setting
> par(par_origin)
> plot(MPG.highway ~ Weight, type = "p", Cars93)
> 
>

(2) 두번째로 개별 그래프마다 그래프 모수를 설정하는 방법을 예로 들어보겠습니다. 그래프 결과는 위에서 par()로 그래프 모수 설정했을 때와 동일함을 알 수 있습니다. 그래프를 그려야 하는 상황에 가장 편리한 방법을 선택해서 사용하면 되겠습니다.

> ## method 2 : setting graphical parameters seperately
> plot(MPG.highway ~ Horsepower, type = "p", # scatter plot with point
+      pch = 15, # point character
+      col = "blue", # color
+      data = Cars93)
>

> 
> plot(MPG.highway ~ Weight, type = "p", # scatter plot with point
+      pch = 21, # point character
+      col = "black", # color
+      data = Cars93)

다음번 포스팅에서는 기호, 선, 색깔, 마진, 영역 분할 등의 그래프 모수의 세부 항목들에 대해서 소개하도록 하겠습니다.

많은 도움이 되었기를 바랍니다.

이번 포스팅이 도움이 되었다면 아래의 '공감 ~♡' 단추를 꾸욱 눌러주세요.^^

728x90

저작자표시 비영리 변경금지

'R 분석과 프로그래밍 > R 그래프_시각화' 카테고리의 다른 글

R 그래프 모수 (Graphical Parameters) : 색깔 (colors), col, col.axis, col.lab, col.main, col.sub, fg, bg (2)	2015.12.26
R 그래프 모수(Graphical Parameters) : 기호 모양 pch, 크기 cex, 선 유형 lty, 선 두께 lwd (0)	2015.12.26
R 그래프 Base Graphics plotting system : hist() boxplot(), stem(), barplot(), dotchart(), pie(), plot() (4)	2015.12.24
R 동적 그래프 (Interactive Plotting in R) : with manipulate package in Rstudio (0)	2015.09.12
R ggplot2 연속확률분포 곡선, stat_function() (0)	2015.09.07

Posted by Rfriend

R (6) 벡터의 곱 - [1] 내적 (inner product, dot product, scalar product, projection product)

R 분석과 프로그래밍/R 선형대수 2015. 12. 8. 00:17

지난번 포스팅에서는 벡터의 기본 개념과 벡터의 합, 차, 스칼라배에 대해서 알아보았습니다.

이번 포스팅에서는 2가지의 벡터의 곱중에서 먼저 내적(inner product, dot product, scalar product, projection product)을 소개하고, 다음번 포스팅에서 외적(outer product, cross product, vector product, directed area product)에 대해서 다루도록 하겠습니다.

[ 벡터 곱 2가지 종류 (2 types of Vector Multiplication) ]

내적(inner product, dot product)과 외적(outer product, cross product)을 비교해보면 아래 표와 같은데요, 처음에 보면 무슨 뜻인가 이해가 안갈 수도 있겠습니다. 내적과 외적의 설명을 다 읽어보시고 마지막으로 종합해서 다시 한번 정리하는데 활용하면 좋겠습니다.

[ 벡터의 내적과 외적 비교 ]

(comparison between inner(or dot) product and outer(or cross) product of vector)

이제 내적(inner product)에 대해서 하나씩 설명해보도록 하겠습니다.

(1) 내적의 표기 (notation and symbol of the inner product)

두 벡터의 내적(inner product)은 아래 그림처럼 「.」(dot)으로 표기하며, 이래서 점곱(dot product)이라고도 말합니다. 혹은 (a, b)와 같이 표기하기도 합니다. 결과값이 스칼라이기 때문에 스칼라곱(scalar product)이라고도 하며, 계산할 때 한쪽 벡터의 코사인값을 사용하기 때문에 (즉, 한쪽 벡터에 직사광선을 쪼였을 때 그 그림자에 해당하는 코사인값을 사용) 영사곱(projection product)이라고도 말합니다.

똑같은 개념을 두고 왜 이리 표현하는 말들이 많은지 의아할 수도 있겠는데요, 대수학, 기하학, 물리학 등의 학문영역별로 명칭, 표기가 다르다는 정도만 이해하면 되겠습니다. 최적화에서도 민감도분석할 때 보면 수학자는 쌍대변수(dual variable)이라고 말하는데 경제학자들은 잠재가격(shadow price)라고 말하거든요. 헛갈리는데 다 같은 말입니다. ^^;

(2) 내적의 정의 (difinition of the inner product)

R^n 내의 두 열 벡터 a, b에 대하여 곱 T(a)b 의 결과인 단일 성분을 갖는 1 * 1 행렬, 즉 하나의 실수인 Scalar 가 내적(inner product)이 되겠습니다. 그 수식을 풀어써보면 아래와 같은 계산식이 되며, 그 output은 스칼라(Scalar)가 됩니다.

참고로, 외적(outer product)은 output이 벡터(Vector)가 됩니다.

아래에 두개의 성분(2차원, 2 dimension)을 가지는 열벡터 a=(-5, 6), b=(3, 9)의 내적 예와 세 개의 성분(3차원, 3 dimensions)을 가지는 열벡터 c=(5, 3, 6), d=(2, 7, 4)에 대한 내적 계산을 소개하였습니다. 같은 행의 component끼리 각각 곱해서 모두 더하면 됩니다.

위의 2개의 문제를 R의 '%*%' 함수를 사용해서 풀어보면 아래와 같습니다.

위에서 소개한 공식을 가지고 아래에 사용자정의 함수도 한번 만들어봤습니다. R에 내적계산을 위한 함수로 '%*%'가 있기 때문에 굳이 사용자정의함수를 사용할 필요는 없겠습니다만, 개념을 이해하는 차원에서 참고하시기 바랍니다.


> ##--------------------------------------
> ## multiplying a vector by a vector
> ##--------------------------------------
> 
> 
> ##---------
> ## (1) dot product
> 
> ## vector with 2 components (dimensions)
> a <- c(-5, 6)
> b <- c(3, 9)
> 
> # dot product of vector with 2 components (dimensions) : (a) %*%
> a %*% b
     [,1]
[1,]   39
> 
> 
> # dot product of vector with 2 components : (b) user defined function
> dot_prod_fun_v2 <- function(a, b) {
+   if(length(a)!=2 | length(b) !=2) stop('number of vector component is not 2')
+   d <- a[1]*b[1] + a[2]*b[2]
+   return(d)
+ }
> 
> dot_prod_fun_v2(a=a, b=b)
[1] 39
> 
> 
> 
> ## vector with 3 components (dimensions)
> c <- c(5, 3, 6)
> d <- c(2, 7, 4)
> 
> # dot product of vector with 3 components (dimensions) : (a) %*%
> c %*% d
     [,1]
[1,]   55
> 
> 
> # dot prduct of vector with 3 components : (b) user defined function
> dot_prod_fun_v3 <- function(c, d) {
+   if(length(c)!=3 | length(d) !=3) stop('number of vector component is not 3')
+   dot_prd <- c[1]*d[1] + c[2]*d[2] + c[3]*d[3]
+   return(dot_prd)
+ }
> dot_prod_fun_v3(c=c, d=d)
[1] 55

(3) 내적의 성질 (properties of the inner product)

수학자들이 정의하는 실내적공간(real inner product space, or real pre-Hilbert space)의 정의와 공리는 아래와 같습니다. 실내적의 공리로 교환법칙(commutative law), 임의의 실수 c곱의 자유로운 이동 가능, 분배법칙(distributive law) 등의 공리도 아래에 소개하였습니다.

(4) 내적의 계산 원리, 방법 1 (1st formula of the inner product calculation)

내적을 계산하는 원리, 방법중에 벡터를 성분분해해서 각 성분들의 벡터의 길이(length of vector, norm)를 가지고 곱한 후 더하는 방법으로 구하는 방법이 있습니다. 아래 그림에 벡터 a를 ax, ay로, 벡터 b를 bx, by로 분해한 후에 내적을 구하는 방법을 소개해 보겠습니다. 힘과 방향을 가지는 벡터를 분해할 수 있다는 것은 벡터 연산을 할 때 굉장히 중요한 개념입니다. 참고로, 벡터와 스칼라를 곱했을 때도 분해한 벡터 성분에 스칼라를 각각 구해서 구하게 됩니다.

(5) 내적의 계산 원리, 방법 2 (2nd formula of the inner product calculation)

내적을 계산하는 또 한가지 방법은 벡터의 힘의 크기 또는 길이(magnitude or length of vector, norm)와 각도(angle between vector a and b)를 이용하는 방법입니다. 벡터의 힘의 크기 또는 길이는 "norm" 이라고도 불립니다. 두 개중 한개의 벡터에 빛을 비추었을 때 직각으로 생기는 그림자 (=vector a * cosine(θ))에다가 나머지 다른 한개의 벡터를 곱하는 개념입니다.

위의 내적 구하는 공식에 cos(θ)가 사용이 되었는데요, 참고로 직각삼각형 ABC의 삼각함수(trigonometric functions) sine, cosine, tangent 구하는 공식은 아래와 같습니다.

참고로 벡터의 힘의 크기 또는 길이(magnitude or length of vector), 또는 다른 말로 "norm" |a|, |b|를 구하는 방법은 아래와 같습니다.

(6) 내적을 활용한 두 벡터의 각도 계산 (calculating the angle between vector a and b)

위에서 소개한 두 벡터의 내적을 구하는 공식을 사용하면 벡터의 길이(length of vector)를 구하거나 혹은 두 벡터간 각도(angle between vector a and b)를 구할 수 있습니다. 왜 내적을 공부해야 하지, 내적을 어디에 써먹을 수 있지 궁금하셨을 것 같은데요, 위에서 예로 들었던 두 벡터 a=(-5, 6), b=(3, 9)의 각도를 내적을 활용해서 구해보도록 하겠습니다.

참고로, 위 계산 절차의 제일 마지막에 cos^-1(0.526354)*57.3 을 했는데요, inverse(cos(0.526354))를 통해서 계산된 값이 degree 가 아니라 radian 이기 때문에 1 radian 은 약 57.3 이므로 이를 곱해준 것입니다. degree는 우리가 일반적으로 사용하는 것처럼 원을 0~360도 표기하는 방법이구요, radian은 부채꼴의 호의 길이와 반지름의 길이가 같게 되는 각도를 1 radian이라고 합니다.

180 degree = π radian 이며, 1 radian = 180 degree/ π = 57.3 입니다.

이를 R을 사용해서 계산해보면 아래와 같습니다. 사용자정의함수로 작성했습니다. 참고로, 함수 acos()는 cos()의 inverse 함수입니다.

> # angle between vector a and b
> a <- c(-5, 6)
> b <- c(3, 9)
> 
> angle_theta <- function(a, b){
+   dot.prod <- a%*%b 
+   norm.a <- norm(a, type="2")
+   norm.b <- norm(b, type="2")
+   theta_radian <- acos(dot.prod / (norm.a * norm.b))
+   angle_theta <- 57.3*theta_radian
+   as.numeric(angle_theta)
+   
+   return(angle_theta)
+ }
> 
> angle_theta(a, b)
         [,1]
[1,] 58.24481

위의 예에서는 이해를 돕기 위해서 2차원 (구성요소가 2개) 벡터 a, b를 가지고만 설명을 했는데요, 내적은 실벡터공간 내 3차원, 4차원, ..., n차원 벡터 모두에 대해서 가능합니다. 반면 외적은 3차원 유클리디안 공간에서만 가능합니다.

다음 번에는 벡터의 곱 두번째로 외적 (outer product, cross product, vector product, tensor product) 에 대해서 소개하도록 하겠습니다.

많은 도움되었기를 바랍니다.

행렬, 벡터 관련 포스팅은 아래 링크를 걸어놓았습니다.

☞ 행렬 기본 이해

☞ 특수한 형태의 행렬

☞ 가우스 소거법을 활용한 역행렬 계산

☞ 행렬의 기본 연산 (+, -, *, /, ^, %*%, colMeans(), rowMeans(), colSums(), rowSums())

☞ 벡터의 기본 이해와 연산 (vector: addition, subtraction, multiplication by scalar)

☞ 벡터의 곱 (2) 외적 (outer product, cross product, vector product, tensor product)

이번 포스팅이 도움이 되었다면 아래의 공감 ♡ 꾸욱~ 눌러주세요. ^^

728x90

저작자표시 비영리 변경금지

'R 분석과 프로그래밍 > R 선형대수' 카테고리의 다른 글

벡터로 점, 축, 직선, 평면, 3차원 공간, n차원 공간 표현하기 (representing n dimensional space by vector) (0)	2016.01.16
R (7) 벡터의 곱 - [2] 벡터곱 (cross product, vector product), 외적(outer product) (9)	2015.12.20
R (5) 벡터(Vector)의 기본 이해와 연산 (합, 차, 스칼라배) (1)	2015.12.05
R (4) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 여인수(cofactor) (1)	2015.12.02
R (3) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 가우스 소거법(Gauss-Jordan elimination method) (5)	2015.12.01

Posted by Rfriend

R (5) 벡터(Vector)의 기본 이해와 연산 (합, 차, 스칼라배)

R 분석과 프로그래밍/R 선형대수 2015. 12. 5. 11:54

이번 포스팅에서는 벡터(vector)의 정의와 연산에 대해서 알아보겠습니다.

벡터는 행렬과 함께 선형대수에서 많이 사용하는 개념이어서 꼭 이해하고 넘어가야 합니다. 벡터 개념과 연산은 중학교 수준의 수학 실력만 있으면 어렵지 않게 이해할 수 있으니 겁먹지 마시기 바랍니다. ^^

벡터(vector)는 여러 학문 분야에서 조금씩 다른 뜻으로 사용이 되고 있어서 혼선이 있을 수도 있는데요, 수학(mathemetics)과 컴퓨터 과학(computer science)에서 정의하는 벡터의 정의에 대해서만 살펴보겠습니다.

[ 수학과 컴퓨터과학에서 벡터의 정의 ]

[mathematics]

vector : a quantity possessing both magnitude and direction, represented by an arrow the direction of which indicates the direction of the quantity and the length of which is proportional to the magnitude.

* compare scalar : a quantity, such as time or temperature, that has magnitude but not direction

[computers]

vector : an array of data ordered such that individual items can be located with a single index or subscript

* source : http://dictionary.reference.com/browse/vector

수학(mathematics)이나 물리학에서는 벡터(vector)는 힘(magnitude)과 방향(direction)을 함께 가지고 있는 양을 말합니다. 화살표로 표현을 하는데요, 화살표의 길이는 힘(lennth of arrow = magnitude)을, 화살표의 방향은 힘의 방향(direction of arrow = direction)을 나타냅니다. 날아가는 야구공, 미사일 등이 벡터(vector)로 힘과 방향을 표현할 수 있겠습니다.

벡터는 보통 a, b, c, ... 처럼 소문자로 굵게(bold) 표기하거나 또는 a = [aj]와 같이 대괄호 안에 성분 표시를 합니다. (참고로, 행렬은 보통 A, B, C, ... 처럼 대문자로 굵게 표기하죠)

반면에, 스칼라(scalar)는 시간이나 온도와 같이 힘만 있고 방향은 없는(only magnitude, but not direction) 양을 말합니다. 특별한 가정이 없는 한 실수(real number)로 나타냅니다.

컴퓨터(computers) 분야에서는 벡터를 개별적인 요소들이 한개의 index나 subscript에 나열할 수 있는 데이터의 배열이라고 정의합니다.

[ 벡터의 정의 ]

벡터의 힘의 크기(magnitude of vector)는 아래 처럼 벡터의 양쪽 바깥쪽에 수직 막대를 한개 또는 두개(절대값 absolute와 혼돈하지 말라고)를 그어주는 것으로 표기합니다.

벡터의 힘의 크기는 유클리디안거리(Euclidean distance) 개념으로 계산합니다.

[ 벡터의 힘의 크기 (magnitude of vector) ]

벡터의 힘의 크기가 1인 벡터를 단위벡터(unit vector)라고 합니다.

[ 단위벡터 (unit vector) ]

열벡터(column vector)는 n by 1 행렬을 말하며, 행벡터(row vector)는 1 by n 행렬을 말합니다.

[ n by 1 열벡터(column vector)와 1 by n 행벡터(row vector) ]

특히 n by 1 벡터 전체로 이루어지는 집합을 R에 이중선을 추가해서

이라고 표기합니다.

선형대수 공부할 때, 최적화 선형계획법 공부할 때 자주 접하게 되는 표기법 중에 하나입니다.

[ 2 by 1, 3 by 1, n by 1 column vector ]

벡터(vector)는 아래와 같이 다양하게 해석할 수 있습니다. 벡터 [3, 5]를 예로 들어서 설명해보겠습니다.

- 해석 1 : 점 (4, 5)

- 해석 2 : 원점(0, 0)과 점(4, 5)를 이은 화살표

- 해석 3 : 원점(0, 0)에서 점(4, 5)까지 가는 화살표들의 합

- 해석 4 : 오른쪽으로 4, 위쪽으로 5만큼 이동하는 모든 화살표 (무수히 많음)

[ 벡터의 다양한 해석 ]

특히, 4번째 해석은 좀 의아할 수도 있는데요, 두 벡터의 크기와 방향이 같을 때, 즉 평행이동했을 때 서로 겹쳐지는 벡터를 '벡터의 상등(equality)'이라고 말하며, 무수히 많이 존재합니다.

행렬은 행벡터 또는 열벡터로 구성되며, 벡터는 행 또는 열이 1개인 행렬이라고 할 수 있습니다. 벡터의 계산은 행렬의 계산과 같습니다.

아래에 벡터끼리의 합, 차, 스칼라곱, 곱에 대한 예를 들어보겠습니다.

(1) 벡터의 합 (adding vectors)

벡터 a는 ax와 ay로 분할할 수 있습니다. 두 벡터 a와 b의 합은 a + b = (ax + bx, ay + by) 로 계산하게 됩니다.

아래에 벡터 a=[4, 5], 벡터 b=[3, 1]의 합 a+b를 예로 들어보았습니다.

R을 활용한 벡터의 합은 행렬의 합과 동일합니다. 벡터 a, b를 객체로 할당하고 + 하면 됩니다.

> ## adding vectors
> 
> a <- c(4, 5)
> b <- c(3, 1)
> 
> a
[1] 4 5
> b
[1] 3 1
> 
> a+b
[1] 7 6

두개의 n by 1 열벡터 a와 b의 합은 아래와 같이 나타낼 수 있습니다.

[ 열 벡터a와 열 벡터b의 합(adding vectors) ]

(2) 벡터의 차 (substracting vectors)

벡터의 차는 같은 위치의 벡터의 성분끼리 빼주면 됩니다. 화살표로는 기존의 벡터의 방향을 반대로 돌려주는 것이 (-)해주는 의미가 되겠습니다. 벡터의 차는 두 점 사이의 거리를 계산할 때 요긴하게 사용할 수 있습니다.

두 벡터 a=[4, 5], b=[3, 1]의 차이를 아래에 예로 들어보았습니다.

[ 벡터의 차 (substracting vectors) ]

R로 벡터의 차를 구하는 것도 역시 행렬과 동일하게 두 벡터 객체에 (-) 해주면 됩니다.

> ## substracting vectors
> a <- c(4, 5)
> b <- c(3, 1)
> 
> a
[1] 4 5
> b
[1] 3 1
> 
> a-b
[1] 1 4

두 개의 m by 1 열벡터 a와 b의 차는 아래와 같이 나나탤 수 있습니다.

[ 열열터 a와 b의 차 (substracting vectors) ]

(3) 스칼라배 (multiplying a vector by a scalar)

위에서 스칼라를 힘만 있고 방향은 없는 양(a quantity that has only magnitude, but not direction)이라고 정의했었는데요, 벡터에 스칼라를 곱하는 것을 스칼라배라고 하고, 곱한 스칼라이 양만큼 벡터의 크기가 바뀌기 때문에 "벡터를 scaling한다"("scaling a vector")고도 합니다.

아래에 벡터 a=[2, 4]에 scalar 2, scalar 1/2 을 곱해보는 예제를 살펴보겠습니다. 방향은 똑같고 스칼라배한만큼 힘의 크기가 달라졌음을 알 수 있습니다.

아래에 위의 예제를 R로 스칼라배 연산해보았습니다.

> ## multiplying a vector by a scalar
> a <- c(2, 4)
> 
> scala_1 <- c(2)
> scala_2 <- c(1/2)
> 
> a*scala_1
[1] 4 8
> 
> a*scala_2
[1] 1 2

n by 1 벡터a에 c스칼라배 하는 것은 아래와 같이 나타낼 수 있습니다.

[ 스칼라배 (multiplying a vector by a scala) ]

스칼라배는 행렬의 곱이 가지고 있는 특성을 고스란히 가지고 있습니다.

[ 행렬의 스칼라배 성질 (principle of multiplying a vector by a scala) ]

벡터의 곱(multiplying a vector by a vector, dot product, cross product)은 다음 포스팅에서 소개하도록 하겠습니다.

많은 도움이 되었기를 바랍니다.

행렬, 벡터 관련 포스팅은 아래 링크를 걸어놓았습니다.

☞ 행렬 기본 이해

☞ 특수한 형태의 행렬

☞ 가우스 소거법을 활용한 역행렬 계산

☞ 행렬의 기본 연산 (+, -, *, /, ^, %*%, colMeans(), rowMeans(), colSums(), rowSums())

☞ 벡터의 곱 (1) 내적 (inner product, dot product, scalar product, projection product)

☞ 벡터의 곱 (2) 외적 (outer product, cross product, vector product, tensor product)

이번 포스팅이 도움이 되었다면 아래의 공감 ♡ 꾸욱~ 눌러주세요. ^^

728x90

저작자표시 비영리 변경금지

'R 분석과 프로그래밍 > R 선형대수' 카테고리의 다른 글

R (7) 벡터의 곱 - [2] 벡터곱 (cross product, vector product), 외적(outer product) (9)	2015.12.20
R (6) 벡터의 곱 - [1] 내적 (inner product, dot product, scalar product, projection product) (4)	2015.12.08
R (4) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 여인수(cofactor) (1)	2015.12.02
R (3) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 가우스 소거법(Gauss-Jordan elimination method) (5)	2015.12.01
R (2) 특수한 형태의 행렬 (0)	2015.11.30

Posted by Rfriend

R (4) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 여인수(cofactor)

R 분석과 프로그래밍/R 선형대수 2015. 12. 2. 01:33

지난 포스팅에서는 가우스 소거법(Gauss-Jordan elimination method)을 활용한 역행렬 계산방법을 알아보았습니다. (☞ 바로가기)

이번 포스팅에서는 여인수(cofactor)를 이용한 역행렬(the inverse of a matrix, invertible matrix) 계산 방법에 대하여 소개하도록 하겠습니다.

이를 이해하기 위해서는 (1) 소행렬식(minor determinant), (2) 여인수(cofactor), (3) 수반행렬(adjoint matrix)에 대해서 먼저 알아보고 나서, 그 다음에 (4) 여인수를 이용한 역행렬 계산 방법을 소개하겠습니다.

(1) 제 (i, j) 소행렬식 (minor determinant)

제 (i, j) 소행렬식이란 n차정방행렬의 i행과 j열을 제거하고 만든 부분행렬의 행렬식(determinant)을 말합니다. i행과 j열이 제거되어서 원래 행렬 A보다 행과 열이 하나씩 작아진 행렬을 가지고 행렬식을구하기 때문에 소행렬식(minor determinant, minor of entry aij)이라고 부릅니다.

아래 3*3 행렬식 A를 예로 들어서 소행렬식을 풀어보겠습니다.

위의 9개 소행렬식 중에서 "제(1, 1) 소행렬식"을 어떻게 구했는지에 대해서 이미지로 표시해보면 아래와 같습니다. 아래의 방식을 9개 소행렬식 모두에 차례로 적용한 것입니다.

R로 행렬식 값 구할 때는 det() 함수를 사용합니다.

> # determinant : det()
> M11 <- matrix(c(1, 2, 0, 4), byrow = TRUE, nrow = 2)
> det(M11)
[1] 4

참고로, 2차정방행렬과 3차정방행렬의 행렬식(determinant) 구하는 공식은 아래와 같습니다.

(2) 여인수 (cofactor)

여인수는 제(i, j) 소행렬식에 (-1)^(i+j)를 곱한 것이며, cofactor의 앞 대문자를 따서 Cij 로 표기합니다.

(Mij 는 소행렬식, minor determinant)

[ 여인수 정의 (definition of cofactor) ]

[ 여인수 행렬 (matrix of cofactors) ]

아래에 3 by 3 행렬 A의 여인수를 구하는 예를 들어보았습니다. 위에 (1)번에서 구해봤던 소행렬식(minor determinant) Mij에 (-1)^(i+j) 를 곱하면 제(i, j) 여인수가 됩니다.

(3) 수반행렬 (adjoint matrix)

수반행렬(adjoint matrix)은 여인수 행렬(matrix of cofactors)의 전치행렬(transpose matrix)를 말하며, adjoint matrix의 앞글자를 따서 adj(A)라고 표기합니다.

[ 여인수 행렬(matrix of cofactors)과 수반행렬 (adjoint matrix)의 관계 ]

위의 3 by 3 행렬 A에 대해서 여인수 행렬(matrix of cofactors) Cij를 바로 위에서 풀어보았는데요, 이 여인수행렬의 전치행렬(transpose matrix)인 수반행렬(adjoint matrix) 예시를 아래에 제시해보았습니다.

(4) 여인수를 활용한 역행렬 계산 (invertible matrix by using cofactors)

여인수를 활용한 역행렬 계산 방식은 아래와 같습니다. 아래 공식처럼 역행렬(the inverse of a matrix)은 수반행렬(adjoint matrix)를 행렬식(determinant)으로 나눈 값입니다. 왜 위에서 소행렬식, 여인수, 수반행렬을 먼저 차례로 살펴보았는지 이제야 이해하실 수 있을 것입니다.

위에서 줄곧 예시로 들었던 3 by 3 정방행렬 A에 대해 여인수를 활용한 역행렬을 구해보면 아래와 같습니다.

[ 여인수를 활용한 역행렬 계산 예시

(example of invertible matrix caculation by using cofactor) ]

위의 역행렬 계산 문제를 R의 MASS패키지 내 ginv() 함수로 풀어보면 아래와 같습니다.

> # the inverse of a matrix, invertible matrix
> A <- matrix(c(1, 0, 1, 0, 1, 2, -1, 0, 4), byrow = TRUE, nrow = 3)
> A
     [,1] [,2] [,3]
[1,]    1    0    1
[2,]    0    1    2
[3,]   -1    0    4
> library(MASS)
> options(digits=2)
> ginv(A)
     [,1]     [,2] [,3]
[1,]  0.8 -3.3e-16 -0.2
[2,] -0.4  1.0e+00 -0.4
[3,]  0.2  0.0e+00  0.2

R base패키지의 solve() 함수를 이용해서 역행렬을 구해도 결과는 동일합니다.

> A <- matrix(c(1, 0, 1, 0, 1, 2, -1, 0, 4), byrow = TRUE, nrow = 3)
> A
     [,1] [,2] [,3]
[1,]    1    0    1
[2,]    0    1    2
[3,]   -1    0    4
> solve(A)
     [,1] [,2] [,3]
[1,]  0.8    0 -0.2
[2,] -0.4    1 -0.4
[3,]  0.2    0  0.2

R로 단 1줄이면 풀어지는 문제에 대해서 컴퓨터는 뒤에서 안보이게 위에서 소개했던 절차들, 즉, 소행렬식, 여인수, 수반행렬을 구하고 그 다음에 역행렬을 구하는 과정을 거쳤을 것입니다. 우리 대신 일해주는 컴퓨터가 있어서 얼마나 좋은 세상인지 모르겠습니다.

많은 도움 되었기를 바랍니다.

행렬, 벡터 관련 포스팅은 아래 링크를 걸어놓았습니다.

☞ 행렬 기본 이해

☞ 특수한 형태의 행렬

☞ 가우스 소거법을 활용한 역행렬 계산

☞ 행렬의 기본 연산 (+, -, *, /, ^, %*%, colMeans(), rowMeans(), colSums(), rowSums())

☞ 벡터의 기본 이해와 연산 (vector: addition, subtraction, multiplication by scalar)

☞ 벡터의 곱 (1) 내적 (inner product, dot product, scalar product, projection product)

☞ 벡터의 곱 (2) 외적 (outer product, cross product, vector product, tensor product)

이번 포스팅이 도움이 되었다면 아래의 공감 ♡ 꾸욱~ 눌러주세요. ^^

728x90

저작자표시 비영리 변경금지

'R 분석과 프로그래밍 > R 선형대수' 카테고리의 다른 글

R (6) 벡터의 곱 - [1] 내적 (inner product, dot product, scalar product, projection product) (4)	2015.12.08
R (5) 벡터(Vector)의 기본 이해와 연산 (합, 차, 스칼라배) (1)	2015.12.05
R (3) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 가우스 소거법(Gauss-Jordan elimination method) (5)	2015.12.01
R (2) 특수한 형태의 행렬 (0)	2015.11.30
R (1) 행렬의 기본 개념 (2)	2015.11.27

Posted by Rfriend

R (3) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 가우스 소거법(Gauss-Jordan elimination method)

R 분석과 프로그래밍/R 선형대수 2015. 12. 1. 00:49

지난번 포스팅에서는 특수한 형태의 행렬, 제로행렬(zero matrix), 전치행렬 (transpose matrix), 대칭행렬 (symmetric matrix), 상삼각행렬 (upper triangular matrix), 하삼각행렬 (lower triangular matrix), 대각행렬 (diagonal matrix), 항등행렬 또는 단위행렬 (identity matrix, I, or unit matrix, U) 등에 대해서 알아보았습니다.

이번 포스팅에서는 역행렬(the inverse of a matrix, invertible matrix)에 대해서 소개하겠습니다. 역행렬은 사용처가 많은 중요한 개념이므로, 아래의 정의, 계산 방법, 존재 여부 확인하는 방벙을 숙지하면 좋겠습니다.

역행렬 (the inverse of a matrix, invertible matrix)

역행렬은 n차정방행렬 Amn과의 곱이 항등행렬 또는 단위행렬 In이 되는 n차정방행렬을 말합니다. A*B 와 B*A 모두 순서에 상관없이 곱했을 때 단위행렬이 나오는 n차정방행렬이 있다면 역행렬이 존재하는 것입니다.

아래에 예를 하나 들어봤습니다.

역행렬은 (1) 가우스 소거법(Gauss-Jordan elimination method), (2) 여인수(cofactor)를 이용해서 풀 수 있습니다. 여인수를 이용한 방법은 복잡해서 보통 가우스 소거법을 주로 사용하는데요, 이번 포스팅에서는 먼저 가우스 소거법을 소개하고, 다음번 포스팅에서 여인수(cofactor)를 이용한 역행렬 구하는 방법을 알아보겠습니다.

가우스 소거법은 기본행연산(elementary row operation)을 이용하여 위의 행렬의 곱의 왼쪽 행렬을 단위행렬로 바꾸어가는 과정이라고 보면 되겠습니다.

[참고] 기본 행연산 (elementary row operation)

1. 행렬의 한 행을 상수배한다.

2. 행렬의 두 행을 맞바꾼다.

3. 한 행을 상수배하여 다른 행에 더한다.

[ 가우스 소거법 예시 (Gauss-Jordan elimination method) ]

R로 역행렬을 풀때는 MASS 패키지의 ginv() 함수를 사용합니다.

> # the inverse of a matrix, invertible matrix
> raw_data <- c(1, 2, 3, 4)
> A_1 <- matrix(raw_data, byrow=TRUE, nrow=2)
> A_1
     [,1] [,2]
[1,]    1    2
[2,]    3    4
> library(MASS)
> ginv(A_1)
     [,1] [,2]
[1,] -2.0  1.0
[2,]  1.5 -0.5
> A_1%*%ginv(A_1)
             [,1]          [,2]
[1,] 1.000000e+00 -6.661338e-16
[2,] 8.881784e-16  1.000000e+00

base 패키지의 solve() 함수를 사용해도 동일합니다.

> solve(A_1)

[,1] [,2]

[1,] -2.0 1.0

[2,] 1.5 -0.5

역행렬이 존재하는 n차정방행렬을 정칙행렬(nonsingular matrix)라고 하며, 역행렬이 존재하지 않는 행렬을 특이행렬(singular matrix)라고 합니다.

역행렬이 존재하는지 여부를 확인하는 방법으로 행렬식(determinant, 줄여서 det)이라는 지표를 사용하는데요, 이 행렬식이 '0'이 아니면 역행렬이 존재하고, 이 행렬식이 '0'이면 역행렬이 존재하지 않습니다.

[ 역행렬이 존재하는 조건 : det(A) ≠ 0 ]

행렬식의 값은 n값에 따라서 달라지는데요, 2차와 3차정방행렬의 행렬식 구하는 공식만 아래에 소개하도록 하겠습니다.

[ 2차, 3차정방행렬의 행렬식 공식, SARRUS method ]

2차정방행렬의 경우 역행렬이 존재하는지를 확인하고 역행렬을 구하는 간단한 공식이 있는데요, 아래 식을 참고하시기 바랍니다. 아래와 같은 공식은 2차정방행렬에만 존재하므로, 3차 이상의 연립방정식을 풀려면 위에서 소개한 가우스 소거법은 알아두시는게 좋겠습니다.

다음번 포스팅에서는 여인수(cofactor)를 이용한 역행렬 계산 방법(☞ 바로가기) 에 대해서 소개하겠습니다.

많은 도움이 되었기를 바랍니다.

행렬, 벡터 관련 포스팅은 아래 링크를 걸어놓았습니다.

☞ 행렬 기본 이해

☞ 특수한 형태의 행렬

☞ 여인수를 활용한 역행렬 계산

☞ 행렬의 기본 연산 (+, -, *, /, ^, %*%, colMeans(), rowMeans(), colSums(), rowSums())

☞ 벡터의 기본 이해와 연산 (vector: addition, subtraction, multiplication by scalar)

☞ 벡터의 곱 (1) 내적 (inner product, dot product, scalar product, projection product)

☞ 벡터의 곱 (2) 외적 (outer product, cross product, vector product, tensor product)

이번 포스팅이 도움이 되었다면 아래의 공감 ♡ 꾸욱~ 눌러주세요. ^^

728x90

저작자표시 비영리 변경금지

'R 분석과 프로그래밍 > R 선형대수' 카테고리의 다른 글

R (6) 벡터의 곱 - [1] 내적 (inner product, dot product, scalar product, projection product) (4)	2015.12.08
R (5) 벡터(Vector)의 기본 이해와 연산 (합, 차, 스칼라배) (1)	2015.12.05
R (4) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 여인수(cofactor) (1)	2015.12.02
R (2) 특수한 형태의 행렬 (0)	2015.11.30
R (1) 행렬의 기본 개념 (2)	2015.11.27

Posted by Rfriend

R (2) 특수한 형태의 행렬

R 분석과 프로그래밍/R 선형대수 2015. 11. 30. 00:31

지난번 포스팅에서는 행렬의 뜻, 형태, 표기법, R로 입력하는 방법에 대해서 소개하였습니다.

이번 포스팅에서는 특수한 형태의 행렬, 제로행렬(zero matrix), 전치행렬 (transpose matrix), 대칭행렬 (symmetric matrix), 상삼각행렬 (upper triangular matrix), 하삼각행렬 (lower triangular matrix), 대각행렬 (diagonal matrix), 항등행렬 또는 단위행렬 (identity matrix, I, or unit matrix, U)의 7가지에 대하여 차례대로 알아보겠습니다.

아래에 소개하는 행렬 형태와 표기법도 잘 기억해두시면 나중에 유용할 거예요. 특히 전치행렬, 대각행렬, 단위행렬, 역행렬은 자주 사용하는 편이니 잘 기억해두면 좋겠습니다.

(1) 제로행렬 (zero matrix or null matrix)

모든 성분이 '0'인 행렬을 제로행렬, 또는 영행렬이라고 합니다.

> # zero matrix
> A_zero <- matrix(c(0, 0, 0, 0, 0, 0, 0, 0, 0), byrow = TRUE, nrow = 3)
> A_zero
     [,1] [,2] [,3]
[1,]    0    0    0
[2,]    0    0    0
[3,]    0    0    0
> 
> B_zero <- matrix(rep(0, 9), byrow = TRUE, nrow = 3)
> B_zero
     [,1] [,2] [,3]
[1,]    0    0    0
[2,]    0    0    0
[3,]    0    0    0

(2) 전치행렬 (transpose matrix)

행이 m개, 열이 n개인 m * n 행렬 (m by n matrix) 의 행과 열을 서로 바꾼 n * m 행렬 (n by m matrix)를 전치행렬이라고 합니다. 아래에 동그라미로 표시한 행렬의 성분들이 전치를 했을 때 서로 어디로 위치가 바뀌었는지를 유심히 살펴보시기 바랍니다.

전치행렬은 행렬 우측 상단에 대문자 'T'를 표기합니다. 아래 표기 예시를 참조하세요.

> # transpose matrix
> A <- matrix(c(1, 2, 3, 4, 5, 6, 7, 8, 9), byrow = TRUE, nrow = 3)
> A
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
> 
> A_t <- t(A)
> A_t
     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9
> 
> 
> B <- matrix(c(4, 5,  6, 7, 8, 9), nc=3)
> B
     [,1] [,2] [,3]
[1,]    4    6    8
[2,]    5    7    9
> 
> B_t <- t(B)
> B_t
     [,1] [,2]
[1,]    4    5
[2,]    6    7
[3,]    8    9

(3) 대칭행렬 (symmetric matrix)

대칭행렬이란 대각성분을 중심으로 대칭인 n차정방행렬로서, 원래 행렬과 전치행렬이 동일한 경우를 의미합니다. (* wikipedia : a symmetric matrix is a square matrix that is equal to its transpose)

> # symmetric matrix
> s <- matrix(c(1:25), 5)
> s
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    6   11   16   21
[2,]    2    7   12   17   22
[3,]    3    8   13   18   23
[4,]    4    9   14   19   24
[5,]    5   10   15   20   25
> 
> lower.tri(s, diag=FALSE)
      [,1]  [,2]  [,3]  [,4]  [,5]
[1,] FALSE FALSE FALSE FALSE FALSE
[2,]  TRUE FALSE FALSE FALSE FALSE
[3,]  TRUE  TRUE FALSE FALSE FALSE
[4,]  TRUE  TRUE  TRUE FALSE FALSE
[5,]  TRUE  TRUE  TRUE  TRUE FALSE
> s[lower.tri(s, diag=FALSE)]
 [1]  2  3  4  5  8  9 10 14 15 20
> t(s)[lower.tri(s, diag=FALSE)]
 [1]  6 11 16 21 12 17 22 18 23 24
> 
> s[lower.tri(s, diag=FALSE)] = t(s)[lower.tri(s, diag=FALSE)]
> s
     [,1] [,2] [,3] [,4] [,5]
[1,]    1    6   11   16   21
[2,]    6    7   12   17   22
[3,]   11   12   13   18   23
[4,]   16   17   18   19   24
[5,]   21   22   23   24   25

(4) 상삼각행렬 (upper triangular matrix)

상삼각행렬은 대각성분 아래의 성분이 모두 '0'인 n차정방행렬입니다. 아래의 색깔 칠해놓은 행렬 예를 보면 금방 이해할 수 있을 거예요.

R의 base패키지 내 lower.tri(x, diag=FALSE) 함수를 이용하여 상삼각행렬(upper triangular matrix)를 아래에 만들어보았습니다.

> # upper triangular matrix
> (m_upper <- matrix(1:20, 4, 4))
     [,1] [,2] [,3] [,4]
[1,]    1    5    9   13
[2,]    2    6   10   14
[3,]    3    7   11   15
[4,]    4    8   12   16
> 
> lower.tri(m_upper, diag=FALSE)
      [,1]  [,2]  [,3]  [,4]
[1,] FALSE FALSE FALSE FALSE
[2,]  TRUE FALSE FALSE FALSE
[3,]  TRUE  TRUE FALSE FALSE
[4,]  TRUE  TRUE  TRUE FALSE
> m_upper[lower.tri(m_upper, diag=FALSE)] <- c(0)
> m_upper
     [,1] [,2] [,3] [,4]
[1,]    1    5    9   13
[2,]    0    6   10   14
[3,]    0    0   11   15
[4,]    0    0    0   16

(5) 하삼각행렬 (lower triangular matrix)

하삼각행렬은 대각성분 위의 성분이 모두 '0'인 n차정방행렬로서, 상삼각행렬과 '0'이 있는 위치가 대각선으로 반대임을 알 수 있습니다.

R의 base패키지 내 upper.tri(x, diag=FALSE) 함수를 이용하여 하삼각행렬(lower triangular matrix)를 아래에 만들어보았습니다.

> # lower triangular matrix
> (m_lower <- matrix(1:20, 4, 4))
     [,1] [,2] [,3] [,4]
[1,]    1    5    9   13
[2,]    2    6   10   14
[3,]    3    7   11   15
[4,]    4    8   12   16
> 
> upper.tri(m_lower, diag=FALSE)
      [,1]  [,2]  [,3]  [,4]
[1,] FALSE  TRUE  TRUE  TRUE
[2,] FALSE FALSE  TRUE  TRUE
[3,] FALSE FALSE FALSE  TRUE
[4,] FALSE FALSE FALSE FALSE
> m_lower[upper.tri(m_lower, diag=FALSE)] <- c(0)
> m_lower
     [,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    2    6    0    0
[3,]    3    7   11    0
[4,]    4    8   12   16

(6) 대각행렬 (diagonal matrix)

대각행렬은 대각성분 이외의 모든 성분이 모두 '0'인 n차정방행렬을 말하며, 아래 예의 대각행렬의 경우 대각성분만을 따다가 diag(1, 2, 3, 4)로 표기합니다.

(* wikipedia : a diagonal matrix is a matrix (usually a square matrix) in which the entries outside the main diagonal (↘) are all zero. The diagonal entries themselves may or may not be zero.)

위에서 소개했던 제로행렬(zero matrix)과 바로 아래에 소개할 단위행렬(unit matrix) 또는 항등행렬(identity matrix)도 대각행렬(diagonal matrix)에 속한다고 할 수 있겠습니다.

그리고 대각행렬은 상삼각행렬(upper triangular matrix) 또는 하삼각행렬(lower triangular matrix)에 속한다고도 할 수 있겠습니다.

R의 diag(A) 함수를 사용해서 위의 diag(1, 2, 3, 4) 대각행렬을 만들어보겠습니다.

> # diagonal matrix
> A <- c(1, 2, 3, 4)
> diag(A)
     [,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    2    0    0
[3,]    0    0    3    0
[4,]    0    0    0    4

대각행렬의 곱셉, P승은 아래와 같이 각 성분의 P승이 되는 재미있는, 유용한 특성을 가지고 있습니다.

(7) 항등행렬 또는 단위행렬 (identity matrix, I, or unit matrix, U)

항등행렬 또는 단위행렬은 대각성분이 모두 '1'이고 그 이외의 모든 성분은 '0'인 n차정방행렬을 말하며, identity matrix 의 첫 대문자를 따서 'I' 로 표기하거나 unit matrix의 첫 대문자를 따서 'U'로 표기합니다. (일부 수학책에서는 독일어 Einheits matrix의 첫 대문자를 따서 'E'로 표기하기도 함)

(* wikipedia : the identity matrix or unit matrix of size n is the n × n square matrix with ones on the main diagonal and zeros elsewhere)

항등행렬 또는 단위행렬 In을 행렬 Amn 에 곱하면 그대로 Amn이 됩니다. 어떤 수에 '1'을 곱하면 그대로 원래의 수가 되기 때문입니다.

R의 diag(k) 함수로 k by 항등행렬 또는 단위행렬을 만들 수 있습니다.

> # identity matrix or unit matrix : diag(k)
> diag(4)
     [,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    1    0    0
[3,]    0    0    1    0
[4,]    0    0    0    1

> diag(6)
     [,1] [,2] [,3] [,4] [,5] [,6]
[1,]    1    0    0    0    0    0
[2,]    0    1    0    0    0    0
[3,]    0    0    1    0    0    0
[4,]    0    0    0    1    0    0
[5,]    0    0    0    0    1    0
[6,]    0    0    0    0    0    1

항등행렬 또는 단위행렬의 역행렬(inverse matrix, 바로 아래에 설명)은 단위행렬입니다. 단위행렬과 역행렬은 매우 중요한 행렬이므로 꼭 잘 이해를 해두시는게 좋습니다.

다음번 포스팅에서는 역행렬(the inverse of a matrix, invertible matrix)에 대해서 소개하겠습니다.

많은 도움이 되었기를 바랍니다.

행렬, 벡터 관련 이전 포스팅은 아래 링크를 걸어놓았습니다.

☞ 행렬 기본 이해

☞ 가우스 소거법을 활용한 역행렬 계산

☞ 여인수를 활용한 역행렬 계산

☞ 행렬의 기본 연산 (+, -, *, /, ^, %*%, colMeans(), rowMeans(), colSums(), rowSums())

☞ 벡터의 기본 이해와 연산 (vector: addition, subtraction, multiplication by scalar)

☞ 벡터의 곱 (1) 내적 (inner product, dot product, scalar product, projection product)

☞ 벡터의 곱 (2) 외적 (outer product, cross product, vector product, tensor product)

이번 포스팅이 도움이 되었다면 아래의 공감 ♡ 꾸욱~ 눌러주세요. ^^

728x90

저작자표시 비영리 변경금지

'R 분석과 프로그래밍 > R 선형대수' 카테고리의 다른 글

R (6) 벡터의 곱 - [1] 내적 (inner product, dot product, scalar product, projection product) (4)	2015.12.08
R (5) 벡터(Vector)의 기본 이해와 연산 (합, 차, 스칼라배) (1)	2015.12.05
R (4) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 여인수(cofactor) (1)	2015.12.02
R (3) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 가우스 소거법(Gauss-Jordan elimination method) (5)	2015.12.01
R (1) 행렬의 기본 개념 (2)	2015.11.27

Posted by Rfriend

이전 1 ··· 13 14 15 16 17 18 19 ··· 27 다음

R, Python 분석과 프로그래밍의 친구 (by R Friend)

'r'에 해당되는 글 267건

R Graphics 낮은 수준의 그래프 함수 (1) 제목 및 XY축 라벨 추가 : title()

'R 분석과 프로그래밍 > R 그래프_시각화' 카테고리의 다른 글

R 그래프 모수 (Graphical Parameters) : 그래프 영역 (mar, oma, , mfrow, mfcol, layout)

'R 분석과 프로그래밍 > R 그래프_시각화' 카테고리의 다른 글

R 그래프 모수 (Graphical Parameters) : 색깔 (colors), col, col.axis, col.lab, col.main, col.sub, fg, bg

'R 분석과 프로그래밍 > R 그래프_시각화' 카테고리의 다른 글

R 그래프 모수(Graphical Parameters) : 기호 모양 pch, 크기 cex, 선 유형 lty, 선 두께 lwd

'R 분석과 프로그래밍 > R 그래프_시각화' 카테고리의 다른 글

R 그래프 모수 (Graphical Parameters) : 그래프 모수 설정하는 2가지 방법

'R 분석과 프로그래밍 > R 그래프_시각화' 카테고리의 다른 글

R (6) 벡터의 곱 - [1] 내적 (inner product, dot product, scalar product, projection product)

'R 분석과 프로그래밍 > R 선형대수' 카테고리의 다른 글

R (5) 벡터(Vector)의 기본 이해와 연산 (합, 차, 스칼라배)

'R 분석과 프로그래밍 > R 선형대수' 카테고리의 다른 글

R (4) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 여인수(cofactor)

'R 분석과 프로그래밍 > R 선형대수' 카테고리의 다른 글

R (3) 역행렬(inverse of a matrix, invertible matrix) : ginv(), 가우스 소거법(Gauss-Jordan elimination method)

'R 분석과 프로그래밍 > R 선형대수' 카테고리의 다른 글

R (2) 특수한 형태의 행렬

'R 분석과 프로그래밍 > R 선형대수' 카테고리의 다른 글

카테고리

태그목록

티스토리툴바