의사결정 트리: 분할 정복(Divide and conquer) 규칙 학습 : 분리 정복(Seperate and conquer) 분할 정복과 분리 정복의 차이점 ○ 분할에 의해 생성된 파티션은 재정복되지 않고 단지 하위 분할만 된다. 즉, 트리는 이전 결정의 이력에 의해 영원히 제약된다. ○ 분리 정복으로 규칙을 발견하면, 규칙의 모든 조건으로 커버되지 않는 어떤 관찰값(예시)든 재정복될 수 있다. # 규칙 학습자(rule learner) 분류기 . 가장 정확도가 높은 규칙 1개를 찾는다.mushroom table(mushroom$type) edible poisonous 4208 3916 # veil_type 변수는 모든 행이 동일한 값 - 분류 기준이 될 수 없음.mushroom$veil_type mus..
분류 전체보기
# csv 파일을 읽어서 데이터 프레임 생성> credit str(credit)'data.frame': 1000 obs. of 17 variables:$ checking_balance : Factor w/ 4 levels " 200 DM",..: 1 3 4 1 1 4 4 3 4 3 ...$ months_loan_duration: int 6 48 12 42 24 36 24 36 12 30 ...$ credit_history : Factor w/ 5 levels "critical","good",..: 1 2 1 2 4 2 2 2 2 1 ...$ purpose : Factor w/ 6 levels "business","car",..: 5 5 4 5 2 4 5 2 5 2 ...$ amount ..
확률의 이해P(A): 사건(event) A가 일어날 확률P(A) = (사건 A가 발생한 횟수) / (전체 시행 횟수)상호 배타적이고 완전한(mutually exclusive and exhaustive) 사건○ 스팸 메일 / 스팸이 아닌 메일 ○ 동전 앞면 / 동전 뒷면 ○ 비가 온다 / 비가 오지 않는다P(Ac ), P(¬A): 사건 A가 일어나지 않을 확률.A의 여사건의 확률P(Ac ) = 1 - P(A) 베이즈 정리를 이용한 조건부 확률 계산 P(A|B): 사건 B가 발생한 경우 사건 A가 일어날 조건부 확률(conditional probability)P(스팸|비아그라) = (스팸 갯수) / (비아그라가 들어있는 메일 갯수) = 4 / 5 = 0.8P(비아그라|스팸) = (비아그라가 들어있는 메일 갯..
# k-NN 알고리즘을 이용한 Iris 품종 분류# k-NN 알고리즘을 구현한 패키지를 설치install.packages("class")# 패키지를 검색경로(메모리)에 로드 library(class)rm(list=ls())# class::knn(학습데이터, 테스트데이터, 학습데이터의정답, k값) # csv 파일에서 데이터프레임 생성iris