방명록

  1. 최진호 2017.02.17 20:57 신고  수정/삭제  댓글쓰기

    선생님 안녕하세요.
    저는 대학원에서 생물 화학쪽을 전공하고 있는 최진호 라고합니다.
    혹시 혹시 선생님께서 R로 생물정보학 혹은 화학정보학쪽도 하시는건가요?

    • R Friend R_Friend 2017.02.17 21:10 신고  수정/삭제

      안녕하세요 진호님, 반갑습니다.

      저는 전에는 마케팅, CRM 했었구요,
      몇년 전부터는 에너지화학, 제조 쪽 분석업무 하고 있습니다.

      생물화학은 제가 안해본, 모르는 분야네요.

      생물정보학에 특화된 분석 스토리가 있을텐데요, 분석기법/알고리즘에 R로 커버가 안되는건 거의 엊ㅅ을겁니다. R 패키지가 5,000여개가 넘거든요.

  2. 강현모 2017.02.14 11:24 신고  수정/삭제  댓글쓰기

    혹시 기계학습에 관해서 책내실생각 없으신가요??
    선생님 글이 어떤책보다도 이해가 잘 되게 설명해주셨네요 ㅋㅋㅋ
    오늘도 또 얻어가네요.
    감사합니다. 좋은하루 되세요~~

    • R Friend R_Friend 2017.02.14 11:54 신고  수정/삭제

      강현모님, 블로그 좋게 봐주셔서 감사합니다.

      직장인이라서 책까지는 생각 못하고 있습니다. 여유가 없어서요. ^^;;;

      방명록 써주신 글 보니 제가 기분이 참 좋네요. 감사합니다.

  3. 김경찬 2017.02.11 12:36 신고  수정/삭제  댓글쓰기


    안녕하세요 선생님, 질문이 있습니다.

    ggplot(May_diff, aes(x=May_day, y=May_diff, fill=plus_minus)) + geom_bar(stat='identity', position='identity')

    ggplot그릴 때 매개변수값으로 identity가 들어간 걸 종종 본거 같아요.
    이 identity는 주로 어떤 경우에 사용하는건가요?
    제가 이해하기로는 ggplot에서 fill값을 적어줄 때 fill의 값이 (범주가) 2개 이상일 때 구분해주기 위한 인자값 정도로 이해했습니다.

    • R Friend R_Friend 2017.02.12 23:53 신고  수정/삭제

      ggplot2의 막대그래프 geom_bar(stat = 'identity') 에서 stat = 'identity' 매개변수는 "x축을 구분"해서 빈도수(frequency, count) 혹은 값 (value)의 크기대로 막대그래프를 그리라는 뜻입니다.

      "x축을 구분"한다고 했을 때

      - (1) x축의 변수가 범주형 자료(categorical data)이면 범주의 갯수만큼 x축이 구분되어 막대그래프가 그려지고

      - (2) x축의 변수가 연속형 자료 (continuous data)이면 x변수 값의 최소값과 최대값 사이의 가능한 모든 값들의 경우의 수를 모두 포함해서 (비록 그 x값에 해당하는 값이 없더라도...) 막대그래프가 그려지는 차이가 있습니다.

      아무튼, 막대그래프에서 stat = 'identity'는 x축을 구분해서 그리라는 뜻이 되겠습니다.

  4. 김경찬 2017.02.06 13:57 신고  수정/삭제  댓글쓰기


    안녕하세요 선생님!
    오늘도 선생님의 블로그를 보며 하루를 시작하는 학생입니다!

    다름이 아니라 공부를 하면서 요청(건의)드리고 싶은게 있어서요.
    실제 raw data를 가지고 정제, 가공하면서 탐색적 분석을 하는 과정과 유의미한 결론을 이끌어 내는 일련의 분석과정들을 보여주실 순 없으신가요?
    선생님의 블로그의 거의 모든 파트들의 내용이 게시되어 있지만 막상 실전에서 적용/활용하려고 하니 생각보다 어려운 것 같습니다.
    혹시 기회가 되신다면 데이터 분석의 시작부터 끝까지의 과정을 가르쳐주신다면 정말 정말 많이 도움이 될 것 같아 이렇게 말씀드리게 되었습니다!

    끝으로 항상 좋은 컨텐츠에 감사드립니다!

    • R Friend R_Friend 2017.02.12 23:29 신고  수정/삭제

      나중에 기회되면 말씀하신 주제로 사례 포스팅 해볼께요. 근데, 그게 언제가 될지는 모르겠습니다. ㅠ.ㅜ

      요즘은 파이썬 연재하고 있어서요...

  5. 김경찬 2017.02.02 17:00 신고  수정/삭제  댓글쓰기

    안녕하세요.
    선생님께 메일로 따로 여쭤보고 싶은 것이 있습니다. 여기 비밀글이 되지 않아서 따로 여쭤보고싶어서요. 가능할까요?

  6. 박준수 2017.02.01 20:37 신고  수정/삭제  댓글쓰기

    안녕하세요! 선생님의 블로그로 r을 공부하고있는 박준수라고 합니다.
    공부하던중 궁금한점이 있어 여쭤봅니다.
    매번 작성하신 내용을 사진(그림or표)같은걸로 요약하시는 데 어떤 프로그램을 사용하시는지 궁금합니다. 감사합니다,

    • R Friend R_Friend 2017.02.01 21:02 신고  수정/삭제

      반갑습니다, 박준수님.

      도표나 그림은 파워포인트로 작성 후 이미지 캡쳐해서 올리고 있습니다.
      해상도가 좀 떨어지는 단점이 있습니다. ^^;

      파워포인트 수식 입력기 사용해서 수식 일일이 입력하는게 고역이고 시간이 많이 걸려요. ㅠ.ㅜ

  7. 김경찬 2017.01.25 16:09 신고  수정/삭제  댓글쓰기

    안녕하세요.
    선생님의 블로그를 RSS피드로 받아서 보고 있습니다.
    그런데 몇몇 컨텐츠(R 포아송분포 , R 이항분포 등)가 불러와지지가 않는데 혹시 제한이 걸려있는 카테고리인가요?

  8. 이현정 2017.01.24 17:54 신고  수정/삭제  댓글쓰기

    안녕하세요~~ ㅎㅎ
    그래프 그리다가 궁금한 점이 있어서 여쭤봅니다.
    제가 ggplot() 함수로 그래프를 그렸는데요.
    그래프의 박스 색깔을 투명(흰색)하게 하고 싶은데 어떻게 해야하나요?
    또 x축 y축 범위를 지정할 수도 있나요??
    항상 도움 주셔서 정말 감사합니다~~
    새해복 많이 받으세용~~ :-)

    • R Friend R_Friend 2017.01.24 18:08 신고  수정/삭제

      (1) ggplo2 배경 투명하게 하는 방법은 아래 키워드로 구글 검색해보시면 예제 있을겁니다.

      plot.background = element_rect(fill = "transparent" , colour=NA)


      (2) 배경 말고 그래프 안의 도형 색깔을 설정하는 방법은 아래 포스팅 참고하세요.

      rfriend.tistory.com/87


      (3) ggplot2 X축, Y축 설정 방법은 아래 포스팅 참고하시구요.

      rfriend.tistory.com/86

  9. 김경찬 2017.01.23 14:43 신고  수정/삭제  댓글쓰기

    안녕하세요.
    블로그 보면서 열심히 공부하고 있습니다.
    정말 블로그를 볼 때면 주인장님의 똑똑함에 감탄사가 절로나옵니다. 프로그래밍언어~수학까지 모든걸 자유자재로 결합하고 응용하고 계신다는 느낌이 들어요. 저도 열심히해서 주인장님과 같은 데이터분석가가 되고싶어요. 따로 오프라인교육같은건 진행안하시죠? 강의가 있다면 찾아뵈서 듣고 싶은 마음입니다.^^

    공부를 하면서 참 어렵다고 생각하는 것이 한달 또는 이전에 공부했던 부분이 잘 기억이 안나서 난감하네요. R공부를 하고 있으면 Python코드가 기억이 잘안나고 선형대수를 공부했어도 나중에 보면 까먹은 부분도 많고... 공부할 건 많은데 어떻게 서로 결합을 시켜야 할 지 고민이 많이 됩니다. 혹시 조금씩이나마 데이터분석을 실전처럼 공부하려면 어떻게 하는게 좋을까요? 인터넷에서 공공데이터를 가져와서 혼자 다뤄보는게 좋을까요? 탐색적분석을 어떻게 시작하는게 좋을지...이런 기본적인 것부터 참 막막합니다.

    항상 좋은 자료 올려주셔서 감사드리고 유료화가 되지 않았으면 좋겠네요.ㅎㅎ

    P.S 최적화와 다변량통계공부를 하기위해 미적분학을 공부해야하는데 어느정도 깊이있게 해야할까요? 대학인강을 찾아보고 있는데 미적분기초와 미적분(THOMAS)가 있더라구요. 기초가 양이 적어서부담이 적은데.... ㅎㅎ

    • R Friend R_Friend 2017.01.24 00:11 신고  수정/삭제

      안녕하세요 김경찬님,

      블로그 좋게 봐주셔서 감사합니다.

      저도 경찬님께서 고민하고 힘들어하시는 것과 똑같은 고민과 어려움을 매일 겪고 있습니다. R 쓰다가 Python 쓰려면 헷갈리고, 함수 매개변수가 정확하게 기억이 안나서 자주 블로그 검색해 보면서 프로그램 짜기도 합니다. 똑같은 기능도 여러개의 패키지가 있고, 패키지마다 함수 사용법이 조금씩 다르다보니 더 헷갈리게 되는거 같아요. 자꾸 쓰다보면 요령(?)이 생겨서 주특기 패키지(가령, 데이터전처리 dplyr, 그래프 ggplot2 등..)가 생기고 자꾸 그거 위주로 쓰면서 손에 익게 되고 하는거 같습니다.

      오프라인 강의는 회사 안에서만 사내강사 활동하고 있어요. 회사 외부 오프라인 강의는 안해요.(규정 상 안됨)
      대신 적어도 일주일에 한개 이상 블로그 포스팅 하려고 안간힘을 쓰고 있으니 블로그 자주 와서 봐주시고, 댓글도 남겨주시면 고맙지요. ^^ 블로그 유료화 계획은 없습니다.

      분석 업무라는게 종합예술이라서 통계, 기계학습, 최적화 등의 분석 지식, 선형대수, 미적분, 확률 등의 기본 지식, R, Python, SAS, SPSS 등의 통계 툴과 프로그래밍 skill, 산업 domain 지식 등이 모두 어우러져야 하므로 시간이 오래 걸리는 분야라고 봐야할 것입니다.

      저도 공부해야할 것은 많고, 항상 시간에 쪼들리고, 무엇부터 공부해야 하나, 얼마나 깊이 공부해야 하나,... 경찬님처럼 똑같은 고민을 매일 하고 삽니다. (기술은 또 왜 이리 빨리 변하고 새로운게 튀어나오는지요. 요즘은 딥러닝이 난리고... 내년엔 또 뭐가 튀어나올런지요... -,-)

      미적분은 이과생이셨다면 고등학교 때 배웠을 미적분이면 최적화, 다변량 통계분석 공부에 부족함이 없을것 같습니다. 편미분 기본 개념 이해하면 이론공부하는데 어려움 없을거예요. (유체역학이나 수치해석... 이런거 할거 아니면요)

    • 김경찬 2017.01.24 09:19 신고  수정/삭제

      답변 감사합니다^^

  10. 강현모 2017.01.23 01:41 신고  수정/삭제  댓글쓰기

    안녕하세요. 기계학습을 공부하기 위해서 선형대수학을 검색하다가 들르게 되었습니다.
    블로거님의 글들을 보면 정말 쉽게 설명해주셨더라고요. 정말 많은 도움이 되었습니다. 감사합니다.
    혹시 기계학습,통계,선형대수학에 도움될만한 책 추천해주실수 있나요??
    선형대수학은 8일간의 선형대수학을 사서 읽어볼 생각입니다.

    • R Friend R_Friend 2017.01.23 13:25 신고  수정/삭제

      원서 중에 무료 pdf 추천해요.

      LINEAR ALGEBRA, by Jin Hefferon, 3rd edition

      다운로드 받는 곳 =>
      joshua.smcvt.edu/linearalgebra/book.pdf

    • 강현모 2017.01.24 10:23 신고  수정/삭제

      감사합니다. 좋은하루 되세요~



티스토리 툴바