사이킷런의 linear_regression 사용하기 위한 패키지 importimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import linear_modelfrom sklearn.datasets import load_diabetes 비만 데이터 LoadX, y = load_diabetes(return_X_y=True)print(X[:5])print(X.shape, y.shape) [[ 0.03807591 0.05068012 0.06169621 0.02187235 -0.0442235 -0.03482076 -0.04340085 -0.00259226 0.01990842 -0.01764613][-0.00188202 -0.04464164 -0.051..
Linear Regression
선형 회귀(Linear Regression)모델 y = ax + b에서, 기울기(slope) a와 y절편 b를 찾는 문제. (a, b)를 특정 값으로 가정했을 때의 예상값과 실제값 사이의 오차들의제곱의 합을 최소로 하는 파라미터 a와 b를 찾는 문제임. 실제값: (x, y)예상값: y_hat = theta1 * x + theta2오차: e = y_hat - y = theta1 * x + theta2 - y오차 제곱: f = e**2 = (theta1 * x + theta2 - y)**2기울기 theta1에 대한 편미분: df/dt1 ~ e * xy절편 theta2에 대한 편미분: df/dt2 ~ e 1) 확률적 경사 하강법(Stochastic Gradient Descent)2) 배치 경사 하강법(Batc..
# 선형 회귀(Linear Regression)# 종속 변수 하나와 독립(설명) 변수들 간의 관계를 수식으로 설명/예측하는 방법# y = a + bx(a, b는 상수)# x: 독립(설명) 변수, y: 종속 변수 # 데이터 준비heights lm_heights lm_heights Call:lm(formula = son ~ father, data = heights) Coefficients:(Intercept) father 86.1026 0.5139 y절편 기울기 > summary(lm_heights) Call:lm(formula = son ~ father, data = heights) Residuals: # 오차/잔차 Min 1Q Median 3Q Max-22.5957 -3.8614 0.0091 4.1230..