Goals
Notes
# ggplot2 패키지를 사용한 그래프
# grammar of graph ( 그래프 그리기 문법)
install.packages(ggplot2)
library(ggplot2)
search()
# ggplot2 패키지의 mpg 데이터 프레임 구조 확인
str(mpg)
# 자동차 배기량(displ)과 시내주행 연비(cty) 사이의 관계
# 1) 그래프를 그릴 데이터(데이터 프레임), 좌표축 설정
g <- ggplot(data = mpg, mapping = aes(x = displ, y = cty)) # aes함수로 x좌표, y좌표를 설정해주어야 함.
summary(mpg$displ)
# 2) 그래프의 종류 선택
g <- g + geom_point() # 좌표축 + 그래프
g
# geom_(point, line, bar ... ) 그래프의 종류를 선택
# 3) 옵션 추가
g <- g + xlim(3, 6) # 좌표축 값의 범위 : x축 xlim, y축 ylim : y- limit
g
Warning message:
Removed 105 rows containing missing values (geom_point).
mpg 데이터와 midwest 데이터를 이용해서 분석 문제를 해결해 보세요.
g <- ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) +geom_point()
g
Q2. 미국 지역별 인구통계 정보를 담은 ggplot2 패키지의 midwest 데이터를 이용해서 전체 인구와 아시아인 인구 간에 어떤 관계가 있는지 알아보려고 합니다. x 축은 poptotal(전체 인구), y 축은 popasian(아시아인 인구)으로 된 산점도를 만들어 보세요. 전체 인구는 50 만 명 이하, 아시아인 인구는 1 만 명 이하인 지역만 산점도에 표시되게 설정하세요.
midwest= as.data.frame(ggplot2::midwest)
h<-ggplot(data=midwest, mapping= aes(x=poptotal, y=popasian)) + geom_point() + ylim(0,10000) + xlim(0,500000)
h
ggplot(data=mpg, mapping=aes(x=displ,y=cty, color = cyl))+geom_point()
ggplot(data=mpg, mapping=aes(x=displ,y=cty, color = as.factor(cyl)))+ geom_point()
ggplot(data=mpg, mapping=aes(x=displ,y=cty,
color = as.factor(cyl),
shape = as.factor(drv)))+
geom_point()