방명록

  1. 정호 2017.03.22 22:04 신고  수정/삭제  댓글쓰기

    안녕하세요. 초대장을 받아보고자 글 남겨 봅니다.

    저는 사진전공자로서 작품 활동 및 각종 전시회 공유를 목적으로
    티스토리르 시작해 보려고 하는데요..

    초대장 보내주시면 성실히 활동 하겠습니다.
    s2is2@naver.com 부탁 드립니다.

    • R Friend R_Friend 2017.03.23 00:18 신고  수정/삭제

      정호님, Tistory 초대장 보내드렸습니다.

      저는 취미로 사진 찍는거 좋아하는데요, 사진 전공하시고 전시회도 한다고 하시니 멋지십니다.

      블로그 대박 나시길 바래요.

    • Horeang 2017.03.23 09:07 신고  수정/삭제

      안녕하십니까! 감사인사 전해 드리려고다시 방문 했습니다. 저에게 좋은 기회 주셔서 정말 감사 드립니다.
      항상 행복 하세요~

  2. Ziicker 2017.03.16 12:01 신고  수정/삭제  댓글쓰기

    안녕하세요.
    R 공부하며 막히는 부분이 있어 질문을 올립니다. 자세한 내용은 댓글로 첨부합니다.

    • 2017.03.16 12:01  수정/삭제

      비밀댓글입니다

    • R Friend R_Friend 2017.03.23 23:12 신고  수정/삭제

      어렵고 복잡하네요.

      이원분산분석은 http://rfriend.tistory.com/136 에 포스팅하긴 했는데요, 풀려고 하는 문제랑은 좀 다를거 같네요.

      불가능했던 조합에 임시로 가짜 데이터를 넣어서 balanced design 으로 해놓고 anova 돌리고 , 해석할때 가짜 제이터 넣었던 조합이 들어간 부분만 무시하면 되지 않을까요?

  3. 강현모 2017.03.14 14:15 신고  수정/삭제  댓글쓰기

    안녕하세요. 질문이 있어서 글을 올립니다.

    교차분석표를 만드는 글을 보았는데,
    gmodels을 이용한 CrossTable의 결과물을 excel로 만드는법도 있나요??
    찾고있는 중인데 잘 모르겠어서요.
    항상 잘 보고 있습니다. 좋은하루 되세요~

    • R Friend R_Friend 2017.03.15 17:11 신고  수정/삭제

      저는 교차분석 결과를 엑셀로 내보내기 해본적은 없는데요, 한번 찾아봐야겠네요.

    • 강현모 2017.03.17 14:42 신고  수정/삭제

      감사합니다~ 만약 제가먼저 찾아내면 댓글드릴께요 ㅋㅋ

  4. 궁금해요 2017.03.09 15:13 신고  수정/삭제  댓글쓰기

    정말 오랜만에 다시 들어와 봅니다.

    전에 추천해주신 책도 잘 읽고 가끔 모르는것이나 까먹은것 찾아보러 종종 들리지만 글은 남지기 못했네요..

    이젠 파이썬도 시작해보려고 합니다. 진짜 많은 도움만 받고 가네요. 감사합니다. 늘 건강하세요~

    나중에 또 찾아 뵙겠습니다.

    • R Friend R_Friend 2017.03.09 16:08 신고  수정/삭제

      요즘 텐서플로우랑 스파크 땜에 파이썬이 인기인것 같습니다.

      블로그 좋게 봐주셔서 감사합니다. ^^

  5. 김경찬 2017.03.08 23:36 신고  수정/삭제  댓글쓰기

    안녕하세요 선생님.

    파이썬 분석쪽 책을 한권 구입해서 보고싶은데 선생님께서 보고 공부하신 책이 뭔지 궁금해서요.
    파이썬 라이브러리를 활용한 데이터 분석(한빛미디어)가 있던데 책이 너무 오래됐네요. 파이썬3에서 안되는 코드도 있다고하고....마음같으면 선생님의 포스팅을 기다리고 싶지만 미리 책을 보면서 혼자 공부도하고싶네요! 혹시 참고할만한 책 있으면 추천 부탁드립니다.ㅠㅠ

    • R Friend R_Friend 2017.03.09 00:20 신고  수정/삭제

      안녕하세요 김경찬님.

      아래는 제가 보고 있는 파이썬 책들인데요, 저는 필요할 때 이 책 저 책 찾아보면서 사용하고 있습니다. 두번 읽은 책도 있고, 아직 다 못 읽은 책도 있고 그래요. 영어 원서는 아마존에서 ebook 산것도 있고 무료 pdf 다운받아서 보는 것도 있는데요, 아마 대부분 번역되어 있을겁니다. 무료 pdf는 파이썬 버전 낮은게 섞여 있어서 3에서는 안되는게 좀 있고요.

      * 기초 다지기용 책들
      - 뇌를 자극하는 파이썬3 (박상현 지음)
      - PYTHON FOR EVERYBODY, exploring data in python 3 (by Charles Severance)
      - PYTHON programming language totorialspoint (www.tutorialspoint.com)

      * 데이터전처리, 분석 (numpy, pandas)
      - Python for Data Analysis (by Wes McKinney)
      - NumPy, Pandas 구글링통해서 매뉴얼 참고

      * 기계학습
      - Machine Learning IN ACTION
      (by Peter Harrington)
      - MACHINE LEARNING IN PYTHON
      (by Michael Bowles)
      - Think Bayes (by Allen B.Downey)

      * 그래프는 구글링해서 주로 matplotlib 라이브러리 매뉴얼 보면서 사용하고 있습니다.

      * 서점가보면 개발자용의 두꺼운 파이썬 책들도 많던데요, 저는 개발자는 아니라서 거기까지는 욕심 안내고 있습니다.

    • 김경찬 2017.03.09 08:59 신고  수정/삭제

      정말 감사드립니다^^ 좋은하루되세요~!!

  6. 김경찬 2017.03.08 11:37 신고  수정/삭제  댓글쓰기

    안녕하세요 선생님.

    제가 포켓몬고의 포켓몬의 위치와 포켓몬 데이터를 가지고 데이터분석을 해보고 싶은데
    찾아보니 파이썬으로 API연동해서 정보를 받아오는 것 같더라구요.

    혹시 R이나 파이썬으로 API연동해서 바로 데이터로 받아올 수 있나요?
    제가 혼자 찾아보니 혼자 하기에는 너무어려워서 괜찮은 방법이 있는가 궁금해서요~

    • R Friend R_Friend 2017.03.08 13:57 신고  수정/삭제

      파이썬이나 R로 open api 연동해서 데이터 가져올수 있을텐데요, 저는 해본적이 없습니다. 저는 주로 DB에 붙어서 데이터 내려서 써요(이건 DB별로 포스팅해놨음).

      구글링해보시기 바랍니다. 도움이 못되어서 죄송합니다.

  7. 이현성 2017.02.27 13:56 신고  수정/삭제  댓글쓰기

    안녕하세요. 분석화학을 전공하고 있는 이현성이라고 합니다.
    R을 독학으로 공부하고있는데요,질문을 드려도 될까요?

    Anova를 여러컬럼에 대해서 한번에 수행할 수 있는지 여쭤보고 싶습니다.

    예를 들면, 반복측정 데이터인데요, 3개의 그룹에 대해서 3번씩 반복실험 결과치를
    각각 컬럼에 대해서는 분석이 가능한데, 한번에 모든 컬럼을 각각 anova 분석을 진행하고 싶습니다.
    Group A B C D E F ...
    1
    1
    1
    2
    2
    2
    3
    3
    3

    결과값 : 그룹(1,2,3)에 대한 A의 anova 결과, 그룹(1,2,3)에 대한 B의 anova 결과 ....

    그리고 사후검정(TukeyHSD)도 동시에 할 수있을지 질문드립니다.

    방법을 찾아봤지만, 찾지 못해 질문드립니다. 감사합니다.

    • R Friend R_Friend 2017.02.27 23:43 신고  수정/삭제

      for loop 프로그래밍 해보시지요.
      아래 포스팅이랑 프로그래밍 카테고리에 있는 여러개 포스팅 참고하세요.

      http://rfriend.tistory.com/90


      "변수의 개수" 만큼 for loop 돌리면서 anova, tukey test 실행시키면 되겠네요.

    • 이현성 2017.02.28 11:15 신고  수정/삭제

      감사합니다!

  8. 최진호 2017.02.17 20:57 신고  수정/삭제  댓글쓰기

    선생님 안녕하세요.
    저는 대학원에서 생물 화학쪽을 전공하고 있는 최진호 라고합니다.
    혹시 혹시 선생님께서 R로 생물정보학 혹은 화학정보학쪽도 하시는건가요?

    • R Friend R_Friend 2017.02.17 21:10 신고  수정/삭제

      안녕하세요 최진호님, 반갑습니다.

      저는 전에는 마케팅, CRM 했었구요,
      몇년 전부터는 에너지화학, 제조 쪽 분석업무 하고 있습니다.

      생물화학은 제가 안해본, 모르는 분야네요.

      생물정보학에 특화된 분석 스토리가 있을텐데요, 분석기법/알고리즘에 R로 커버가 안되는건 거의 엊ㅅ을겁니다. R 패키지가 5,000여개가 넘거든요.

  9. 강현모 2017.02.14 11:24 신고  수정/삭제  댓글쓰기

    혹시 기계학습에 관해서 책내실생각 없으신가요??
    선생님 글이 어떤책보다도 이해가 잘 되게 설명해주셨네요 ㅋㅋㅋ
    오늘도 또 얻어가네요.
    감사합니다. 좋은하루 되세요~~

    • R Friend R_Friend 2017.02.14 11:54 신고  수정/삭제

      강현모님, 블로그 좋게 봐주셔서 감사합니다.

      직장인이라서 책까지는 생각 못하고 있습니다. 여유가 없어서요. ^^;;;

      방명록 써주신 글 보니 제가 기분이 참 좋네요. 감사합니다.

  10. 김경찬 2017.02.11 12:36 신고  수정/삭제  댓글쓰기


    안녕하세요 선생님, 질문이 있습니다.

    ggplot(May_diff, aes(x=May_day, y=May_diff, fill=plus_minus)) + geom_bar(stat='identity', position='identity')

    ggplot그릴 때 매개변수값으로 identity가 들어간 걸 종종 본거 같아요.
    이 identity는 주로 어떤 경우에 사용하는건가요?
    제가 이해하기로는 ggplot에서 fill값을 적어줄 때 fill의 값이 (범주가) 2개 이상일 때 구분해주기 위한 인자값 정도로 이해했습니다.

    • R Friend R_Friend 2017.02.12 23:53 신고  수정/삭제

      ggplot2의 막대그래프 geom_bar(stat = 'identity') 에서 stat = 'identity' 매개변수는 "x축을 구분"해서 빈도수(frequency, count) 혹은 값 (value)의 크기대로 막대그래프를 그리라는 뜻입니다.

      "x축을 구분"한다고 했을 때

      - (1) x축의 변수가 범주형 자료(categorical data)이면 범주의 갯수만큼 x축이 구분되어 막대그래프가 그려지고

      - (2) x축의 변수가 연속형 자료 (continuous data)이면 x변수 값의 최소값과 최대값 사이의 가능한 모든 값들의 경우의 수를 모두 포함해서 (비록 그 x값에 해당하는 값이 없더라도...) 막대그래프가 그려지는 차이가 있습니다.

      아무튼, 막대그래프에서 stat = 'identity'는 x축을 구분해서 그리라는 뜻이 되겠습니다.



티스토리 툴바