# 설치 전 반드시 자바를 설치하고 path를 잡아주어야 함.# word cloud# R에서 Java를 사용한 패키지를 이용할 수 있도록 해주는 패키지!!install.packages('rJava')#KoNLP 패키지(한국어 분석)가 사용하는 패키지install.packages('memoise')#KoNLP(Korean Natural Language Processing): 한국어 자연어 처리install.packages('KoNLP')# 문자열을 처리하는 여러가지 함수들을 가지고 있는 패키지install.packages('stringr') # wordcloud 작성 패키지install.packages('wordcloud') # 설치한 패키지들을 검색경로(메모리)에 로드library(KoNLP)librar..
R
# 복지패널 데이터 분석 # 필요한 라이브러리 로드library(dplyr)library(ggplot2)search() # 저장해둔 R 데이터 파일을 로드 -> 변수 자동 생성rm(list=ls())load('data/welfare.rda') #데이터프레임 확인str(welfare)welfare %>% select(code_job, job) %>% head(10) code_job job1 NA 2 NA 3 942 경비원 및 검표원4 762 전기공5 NA 6 530 방문 노점 및 통신 판매 관련 종사자7 NA 8 NA 9 NA 10 NA > table(is.na(welfare$job)) FALSE TRUE7529 9135 직업별 평균 소득 분석income_by_job = welfare %>% filter(..
Goals연령대별(age gap) 평균급여, 연령대별 평균 급여 테이블, 연령대 + 성별 평균 급여 그래프, ageg 변수를 순서형 변수로 만듦, factorposition = 'dodge', 엑셀파일 로드해 새로운 데이터 프레임 생성, 데이터 프레임 저장하기 / 불러오기 Notes # 연령대별(age gap) 평균급여# 연령대를 30세 미만(young), 60세 미만(middle), 60세 이상(old) 구간으로 나눔.welfare = welfare %>% mutate(ageg = ifelse(age% filter(!is.na(income)) %>% group_by(ageg) %>% summarise(mean= mean(income)) > income_by_ageg# A tibble: 3 x 2 age..
Goals복지패널데이터 다운로드, 변수 이름을 분석하기 쉽게 변경, 성별에 따른 월급 차이, 그래프 생성시 NA값 제외이상치 NA로 처리하기, label 붙이기, 막대 색 채우기 : fill # 복지 패널 데이터 https://github.com/youngwoos/Doit_R 에서 다운로드 + 한국복지패널데이터_etc에서 관련 자료 다운로드 + 참고용 codebook rm(list=ls()) #통계 전용 프로그램 SPSS에서 만들어진 sav file을 읽어서#데이터 프레임을 생성하려면 foreign 패키지가 필요 # 분석에 필요한 패키지들을 검색 경로에 로드library(foreign)library(dplyr)library(ggplot2)library(readxl)search() # 데이터 구조 확인st..