Coding Diary.

(Machine Learning) 다항 회귀 본문

Coding/Machine Learning

(Machine Learning) 다항 회귀

life-of-nomad 2023. 9. 7. 14:41
728x90
반응형

선형회귀에 대해 알아보았습니다. 그런데 입력 변수와 목표 변수의 관계를 가장 잘 나타내는 게 직선이 아닐 수도 있습니다. 아래의 예시를 봅시다. 

직선을 최대한 잘 그린것 같지만 이 직선이 데이터를 잘 표현한 것 같진 않습니다. 

직선이 아닌 곡선을 사용해봅시다.

이 곡선을 어떻게 찾을 수 있을까요? 선형 회귀에서는 가설 함수가 아래와 같이 생겼었습니다.

이 가설함수는 직선이니까, 가설 함수를 곡선으로 바꾸면 됩니다.

예를 들어, 이 데이터에 가장 잘 맞는 곡선이 이차 함수 일 것 같으면

이런 식으로 써주면 됩니다. 만약 데이터에 가장 잘 맞는 곡선이 이차 함수가 아니라 삼차 함수일 것 같으면

이렇게 가설 함수를 정하면 되고, 4차 함수 일 것 같으면

5차 함수 일 것 같으면

이런 식으로 함수의 차수가 더 높을수록 더 굴곡이 많은 곡선입니다. 우리가 데이터를 보고 적합할 것 같은 모양을 골라야 합니다. 

이런 식으로 데이터에 잘 맞는 일차 함수나 직선을 구하는 게 아니라 다항식이나 곡선을 구해서 학습 하는 것을 '다항회귀(polynomial regression)'이라고 부릅니다. 

728x90
반응형