여러 변수를 사용한 선형 회귀는 "다변량 선형 회귀"라고도 합니다.
입력 변수가 여러 개일 때의 방정식 표기법을 소개합니다.
xj(i)=x^{(i)}_{j}= i번째 훈련 예제 중 특징 j의 값
x(i)=x^{(i)}= 훈련 집합의 i 번째 입력 특징
m=m= 훈련집합의 개수
n=n= 특징의 개수
여러 개의 (입력) 특징이 있는 가설 함수의 다중 변수 형태의 표현은 아래와 같습니다.
hθ(x)=θ0+θ1x1+θ2x2+θ3x3+⋯+θnxn h_\theta (x) = \theta_0 + \theta_1 x_1 + \theta_2 x_2 + \theta_3 x_3 + \cdots + \theta_n x_n
이 함수에 대한 이해를 돕기 위해 θ0\theta_0는 주택의 기본 가격, θ1\theta_1는 단위 넓이당 가격, θ2\theta_2를 층당 가격 등으로 x1x_1를 해당 주택의 넓이, x2x_2를 해당 주택의 층수로 생각하겠습니다.
행렬곱의 정의를 사용하여, 우리의 다중 변수 가설 함수는 다음과 같이 표현할 수 있습니다.
hθ(x)=[θ0θ1...θn][x0x1...xn]=θTx h_θ(x)= \begin{bmatrix} \theta_0 & \theta_1 & ... & \theta_n \end{bmatrix} \begin{bmatrix} x_0\\x_1\\...\\x_n \end{bmatrix} =\theta^Tx
이것은 하나의 훈련 값에 대한 가설 함수의 벡터표현입니다.
비고 : 이 강좌에서는 편의를 위하여 x0(i)=1x_{0}^{(i)} =1 for (i∈1,…,m)(i\in { 1,\dots, m } )(i∈1,…,m) 로 가정하였습니다. 이 가정에 따라 쎄타(theta)와 x에 대한 행렬 연산을 수행할 수 있습니다. 따라서 ′θ′'\theta' 와 x(i)x^{(i)} 두 개의 벡터가 각 요소별로 일치합니다. (즉, 각 벡터가 n+1 개의 요소를 가집니다.)
출처
'머신러닝' 카테고리의 다른 글
선형회귀를 위한 경사하강법 (Gradient Descent For Linear Regression) (0) | 2018.10.02 |
---|---|
경사하강법의 직관적인 이해(Gradient Descent Intuition) (0) | 2018.09.17 |
경사하강법 (Gradient Descent) (0) | 2018.09.13 |
비용함수 (Cost Function) (0) | 2018.09.10 |
모델 표현(Model Representation) (0) | 2018.09.07 |