본문 바로가기
도서

비즈니스 활용 사례로 배우는 데이터 분석 R

by 퍼포먼스마케팅코더 2017. 2. 8.
반응형

비즈니스 활용 사례로 배우는 데이터 분석 R비즈니스 활용 사례로 배우는 데이터 분석 R


추천대상: 데이터 분석 입문자, 모바일/PC게임 통계/분석 실무자, 밸런스 기획자, 데이터 분석 입문자

추천별수: 4.7/5.0

추천이유? 


적어도 위에 적힌 대상자들에겐 딱 안성맞춤 책이다... 적어도 나 같은 경우 책에 내용의 이론이 굉장히 실용적인지 아닌지가 늘 관심대상이다. 

요새 서적에 나온 데이터 분석 관련 책들을 보면 전혀 실무에 도움되지 않는 내용들이 즐비하기 때문에... 

그런데 저 책은 딱 실무적인 내용들이 많이 들어있어서 단번에 내용만 보고 구입했다. 

그리고 책 내용을 보고 단순히 일주일만 보고 접을라던 계획을 1달 정도 늘려서 R 프로그래밍과 함께 현재 실습하고 있다. 

한 가지 유의사항을 말하자면, 기본 통계지식과 기본 R 프로그래밍 지식을 뗀 다음에 봐야 조금 수월할 것이다. 

(그냥 초보자분이 보신다면... 3~6장만 보길 권한다. 7~10장은 좀 더 난이도를 요구하기 때문에...)


R 프로그래밍을 배운 적 조차 없는 나도 3~6장은 비교적 수월~하게 넘어가지만, 

7장부터 나오는 로지스틱 회귀분석, 주성분분석, 클러스터링, 의사결정나무(디시전트리), 머신러닝 내용은 굉장한 난이도를 요구한다. 

(R 프로그래밍과 통계적 지식이 해박한 분이라면 아마 7장 이후 내용도 굉장히 쉬울 것이다.)


뭐 나만 7장 이후부터 내용이 어려웠는지는 모르겠지만... 

R프로그래밍으로 완벽히 이해한 다음 책 내용을 실습하기까지 기간 소요를 한 달로 계산한 것이다. 


문제는 7장부터인데... 7장부터 보는 순간 아 R 프로그래밍 함수 내용을 훑어보고, 

ggplot2 패키지의 내용 등이 뭐가 있는지를 많이 봐야할 것이라고 직감했다. 


또한 중요한 점은, 내가 MSSQL에서 쿼리로 뽑아 엑셀에서 7만 개 이상 raw data를 분석할 때보다 확실히 R로 넣어  raw data를 분석하면 굉장히 빠르다는 점이다. 


물론 SAS, SPSS를 사용하지 않아 정확히 비교하긴 어렵지만, R과 엑셀을 비교하자면 R을 배워야될 필요성이 굉장히 증가하게 된다. 

(아, 이래서 R을 이용하는구나 라는 게 바로 듬..)


앞으로 한 달 정도는 계속 이 책에 있는 R 프로그래밍 내용을 보려고 한다. 

게임업계에 맞게 굉장히 실용적으로 잘 써놨고,

여기 내용을 응용해서 실무에 적용시켜보려고 한다. 

 

다만.. 아직도 데이터 마이닝 내용이 있는 로지스틱 회귀분석, 주성분분석, 클러스터링, 의사결정나무(디시전트리), 머신러닝을 보고.. 

머신 러닝에 대한 내용도 많이 공부해야곘다는 생각이 들었다. 

그리고... 늘 강조하는 거지만..


분석기법도 중요하나, 분석이론도 틈틈히 공부해야할 것. 


해야할 일이 참 많다. 

반응형

댓글