[R 프로그래밍] 여고생 성형관련 워드클라우드

#주요 패키지 설치 및 로딩한 후 분석

library(KoNLP)

library(wordcloud)

useSejongDic()

data1 <- readLines("remake.txt")

data1

data2 <- sapply(data1,extractNoun,USE.NAMES=F)

data2

data3 <- unlist(data2)

data3 <- Filter(function(x) {nchar(x) <= 10} ,data3)

head(unlist(data3), 30)

data3 <- gsub("\\d+","", data3) ## <--- 모든 숫자 없애기

data3 <- gsub("쌍수","쌍꺼풀",data3)

data3 <- gsub("쌍커풀","쌍꺼풀",data3)

data3 <- gsub("메부리코","매부리코",data3)

data3 <- gsub("\\.","",data3)

data3 <- gsub(" ","",data3)

data3 <- gsub("\\'","",data3)

data3

#공백 제거

write(unlist(data3),"remake_2.txt")

data4 <- read.table("remake_2.txt")

data4

nrow(data4)

wordcount <- table(data4)

wordcount

#필요없는 단어 제거

head(sort(wordcount, decreasing=T),20) # 가장 많이 언급된 상위 20개만 확인

txt <- readLines("성형gsub.txt") # 제거하고싶은 단어 목록을 불러오기

txt

cnt_txt <- length(txt)

cnt_txt

i <- 1

for( i in 1:cnt_txt) {

data3 <-gsub((txt[i]),"",data3)

}

data3 # ?-- 제거되어 있을 거예요~

data3 <- Filter(function(x) {nchar(x) >= 2} ,data3)

write(unlist(data3),"remake_2.txt")

data4 <- read.table("remake_2.txt")

data4

nrow(data4)

wordcount <- table(data4)

wordcount

head(sort(wordcount, decreasing=T),30)

#워드클라우드 생성

library(RColorBrewer)

palete <- brewer.pal(9,"Set3")

wordcloud(names(wordcount),freq=wordcount,scale=c(5,1),rot.per=0.25,min.freq=2,

random.order=F,random.color=T,colors=palete)

legend(0.3,1 ,"여고생들이 선호하는 성형수술 부위",cex=0.8,fill=NA,border=NA,bg="white" ,

text.col="red",text.font=2,box.col="red")

저작자표시

'R' 카테고리의 다른 글

[R 프로그래밍] 대학생 관심 대상 워드 클라우드 (0)	2017.02.13
[R 프로그래밍] 대학생 가장 많이 검색하는 단어 기준 워드클라우드 테스트 (0)	2017.02.13
[R 프로그래밍] 한글패키지 및 워드클라우드 생성 (0)	2017.02.12
[R 프로그래밍] R 프로그래밍 언어의 특징 (0)	2017.02.12
[R 프로그래밍] MAU 통계 집계 후 히스토그램, 크로스집계 (0)	2017.02.10

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

퍼포먼스 마케팅 데이터 분석

[R 프로그래밍] 여고생 성형관련 워드클라우드

'R' 카테고리의 다른 글

댓글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

[R 프로그래밍] 여고생 성형관련 워드클라우드

'R' 카테고리의 다른 글

관련글

댓글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역