본문 바로가기

AI/Deep Learning

[모두를 위한 딥러닝(Sung Kim)|ch.2-1] Linear Regression의 Hypothesis와 cost

Linear Regression의 Hypothesis와  cost

 

 

 

Supervisored learning 한다고 가정

data를 가지고 진행

0~100 점 사이

regression

data를 가지고 학습

trainning

data 는 trainning data

regression medel이 data를 가지고 학습

학습이 끝난 후에

regression의 사용은

 

ex) 7시간 공부

AI에게 질문 이 학생이 몇점이나 받을 수 있을까?

 

기존 데이터를 이용해서 예측한다.

기본적인 ML의 컨셉

Linear regression

 

x,y는 서로의 관계를 나타내며 여기서는 학습데이터이다.

 

 

 

  • Linear Hypothesis 

 

 

 

 

어떤 데이터가 있다면 여기에 맞는 linear한 선을 찾는 것이라고 할 수 있다.

알맞는 선을 찾는게 학습이라 할 수 있다.

가설과 실제 데이터가 서로 가까울 수록 알맞은 선이다.

 

어떤 linear가 우리가 가진 데이터에 알맞은 linear일지 알아낼 수 있어야한다.

H(x) = Wx +b

가중치를 알아야한다.

 

 

  • Cost function

가설과 실제 데이터의 차이를 알아낼 때 사용

How if the line to our (training) data

(H(x) -y)^2

음수가 있어도 제곱을 사용하므로 둘의 차이에 따른 가중치를 알 수 있으며

서로 간의 거리가 멀때 

제곱이므로 값이 더 커진다.

그러므로 가설과 실제 데이터의 차이를 알아내는데 더 용이하다.

 

가설에서의 값실제 데이터의 값의 차이를 제곱한 것들의 평균  => Cost function

 

H(x) = Wx +b // 가설 linear 식

 

cost(W, b)의 값을 가장 적게 하는 것이 linear regression의 학습이 된다

가설과 실제 데이터의 차이를 적게하는 것이 목표이다.

trainning 시킨 모델이 나중에 실제 예측할 때 더욱 정확한 예측을 할수 있으므로 그렇다.